首頁 > AI資訊 > 行業應用 > 合合信息丨探尋AI安全治理,共筑可信AI未來

合合信息丨探尋AI安全治理,共筑可信AI未來

新火種    2024-12-30

日前,由中國計算機學會計算機視覺專委會主辦,合合信息承辦,中國運籌學會數學與智能分會協辦的《打造大模型時代的可信AI》論壇順利舉行。論壇匯聚了來自上海交通大學、電子技術標準化研究院、中國科學技術大學、中科院、合合信息等機構與企業的眾多專家,共同探討AI安全治理的新路徑。

隨著以ChatGPT為代表的AI大語言模型技術的飛速發展,數據安全、知識產權、算法偏見和有害內容生成等問題日益凸顯。上海交通大學人工智能研究院教授、總工程師金耀輝在論壇上提出“訓練對齊、提示引導和文本過濾”三大安全保障手段,旨在將抽象的安全概念落實到具體的技術研發流程中,確保AI大模型在生成內容時的安全性和可靠性。

除了技術手段,規范標準也是AI健康發展的重要保障。中國電子標準院網安中心測評實驗室副主任、CCIA數安委常務副主任何延哲表示,當前人工智能安全檢測主要停留在內容安全層面,檢測方法相對單一。他提出了一個綜合評估框架,包括算力網絡安全、數據安全、個人信息保護、算法模型安全、網絡信息安全和科技倫理安全六方面,為人工智能安全檢測評估提供了全面而系統的指導。

在技術實踐方面,中國科學技術大學教授、國家杰青謝洪濤以特定人物深度偽造視頻為研究對象,分享了主動防御和被動檢測兩種治理方案。主動防御通過前置保護措施,如雙重水印技術,為視頻生成或傳播過程提供安全保障;被動檢測則通過圖像級不一致性和時空身份不一致性檢測技術,評估視頻的真實性。

合合信息圖像算法研發總監郭豐俊也介紹了公司在圖像篡改檢測方面的最新成果。基于數據驅動的神經網絡模型,合合信息推出了行業領先水平的圖像篡改檢測方案,能夠提取篡改留下的細微痕跡,檢測出多種篡改形式。郭豐俊表示,大模型技術的出現為AI視覺安全的發展帶來了新的可能,也為應對檢測泛化能力和抗攻擊能力的挑戰提供了契機。

(合合信息圖像算法研發總監郭豐俊)

此外,中國科學院自動化研究所研究員、IEEE/IAPR Fellow赫然博士從深度合成技術出發,詳細分析了虛擬身份、身份重演和人臉驅動三種合成技術類型,并提出了多模態多線索的鑒偽方法和有針對性的圖像鑒別方案。

隨著生成式人工智能的不斷發展,技術革新與安全治理缺一不可。面對AI的潛在風險,加強行業內部自律,從源頭做好安全措施是守護AI健康成長的第一道防線。未來,合合信息將持續深耕AI視覺安全領域,積極推動行業合作與交流,共同打造大模型時代的可信AI。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章