民生銀行數據管理部沈志勇:對大模型可進行兩種教育和設立三道防線
21世紀經濟報道記者邊萬莉北京報道 11月21日,由21世紀經濟報道主辦的“2023首席科技官思享會(閉門會)”在北京成功舉行,聚焦大模型的熱點話題,金融機構、金融科技公司等資深人士進行了深入研討。
民生銀行數據管理部總經理沈志勇在發表主旨演講時表示,“判斷一家企業是否能做好大模型,至少應從算力規模、NLP(自然語言處理)基礎、數據積累這幾個維度來判斷。算力規模影響大模型的迭代速度;大語言模型屬于NLP領域,因此NLP能力積累至關重要;而海量文本數據是訓練大語言模型的重要基礎。”
沈志勇認為,大模型應用于銀行領域至少可以提升生產效率、重塑知識體系以及改善內外部用戶的體驗。比如,輔助員工生成文本、代碼等內容,更快、更富體驗地滿足行內外用戶知識獲取的需求等。對此,除了模型本身,銀行還需要建設算力基礎;準備訓練數據;建設模型訓推和應用框架等。
“應用大模型一定要注意安全合規。”沈志勇表示,從數據角度看,可以對大模型進行兩種教育和設立三道防線。其中,兩種教育,一是訓練時通過數據注入正確的價值觀;二是在訓練時通過強化學習對模型的錯誤回答進行糾偏。三道防線是指過濾掉訓練數據、模型返回結果以及用戶提問中的不良內容。
沈志勇提出,不能忽略大模型運行的經濟性,須結合傳統AI技術做好智能資源的優化配置。同時,還要做好各方對于投入產出的期望管理。關于大模型技術未來的發展方向,橫向是往多模態的發展,縱向個人比較看好智能體。
(文章來源:21世紀經濟報道)
相關推薦
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。