上海鋼聯:成功開發了大宗商品行業首個垂類大語言模型的應用“小鋼”數字智能助手
上海鋼聯電子商務股份有限公司(以下簡稱“上海鋼聯”或“公司”)12月18日晚間發布公告稱,公司于12月16日與多家機構投資者進行了上市公司投資者交流活動。在活動中,上海鋼聯透露,公司在一年時間內完成了“鋼聯宗師”大宗商品行業垂直大語言模型1.0版的研發,并在“鋼聯宗師”的能力上,基于大宗商品行業的貿易、分析咨詢和內容生成三個場景,成功開發了大宗商品行業首個垂類大語言模型的應用——“小鋼”數字智能助手。該產品還處于試用階段,需要通過邀請各行業用戶進行試用,來測試產品的穩定性和適用性。如果試用效果良好,那么該產品就有可能正式定價銷售,為更多的用戶提供服務。
12月16日下午,上海鋼聯在“2024大變局·新動能中國鋼鐵市場展望暨‘我的鋼鐵’年會”上正式發布“鋼聯宗師”大宗商品行業垂類大語言模型及“小鋼”數字智能助手。
會上介紹,通過在基模的基礎上預訓練大量的高質量大宗商品行業語料、指令微調和強化對齊三個過程,在一年的時間內完成了“鋼聯宗師”大宗商品行業垂直大語言模型1.0版的研發,并在“鋼聯宗師”的能力上,基于大宗商品行業的貿易、分析咨詢和內容生成三個場景,成功開發了大宗商品行業首個垂類大語言模型的應用——“小鋼”數字智能助手。
“小鋼”助手具備價格和數據查詢、行業百科問答、資訊整理和內容匯總、知識內容生成、報告解讀和分析預測等多種能力,通過人機對話的方式跟用戶進行交互,簡化了傳統的信息獲取、內容分析和知識生成的繁瑣和低效的步驟,輔助行業用戶更高效地完成日常的工作。
以下為投資者關系活動主要內容:
1、“小鋼”數字智能助手的基座模式是什么?
答:鋼聯團隊在研發面向大宗商品場景的大語言模型時,經歷了從基于第三方接口到自主研發的轉變,最終選擇了“百川”作為基礎模型并順利應用。目前,團隊正與上海市人工智能實驗室合作,計劃使用書生模型,以更好地適應產業需求和實現制造業場景的落地。鋼聯認為,圖像聲音是多模態能力的重要組成部分,“書生浦語”模型所在的上海市人工智能實驗室在視覺方面表現較強。并且人工智能實驗室給鋼聯提供了大力支持,包括高科技研發資源和頂尖算法人才的參與,共同推動該項目的發展。
2、多模態之后的模型的參數量是否需要增加?
答:公司和上海市人工智能實驗室正在共同進行面向產業的多模態大模型研發,但具體使用哪個版本實現對應模塊的能力還需在研發過程中決定。多模態可能包括語音、圖像和文本等不同方面,不同版本可能有所不同。因此應用在“小鋼”數字智能助手這個產品具體擬合了多少個不同版本或其他版本尚不確定。
3、客戶對“鋼聯宗師”大語言模型和“小鋼”數字智能助手評價如何?后續商業化是如何開展?
答:前期公司內測,內部分析師對“小鋼”數字智能助手的評價雖有不足,但已經能夠提供很多工作上面的輔助作用?!靶′摗敝痔岣吡擞脩粼谄脚_找信息和知識加工的效率,使得用戶不必再繁瑣地尋找信息,能夠提高工作效率。同時,分析師們也在使用“小鋼”助手來輔助寫稿,幫助他們更快速地分析和解讀市場趨勢和數據,能夠更加專注于分析和研究工作,而不必花費過多的時間和精力在寫作和整理上。
目前整體規劃是邀請各行業用戶試用,根據體驗結果決定是否正式定價銷售。這一規劃表明該產品還處于試用階段,需要通過邀請各行業用戶進行試用,來測試產品的穩定性和適用性。如果試用效果良好,那么該產品就有可能正式定價銷售,為更多的用戶提供服務。
4、小鋼助手目前是否僅有web端?什么時候可以有移動端、終端產品?
答:公司在大數據模型方面的三步走戰略,包括解決內部降本增效和增量問題、模型產品化以及將所有產品用大模型技術重做。此外,公司正在開發一個Word版的插件,將鋼聯的數據研究、查詢和內容寫作場景集中到該插件中。下一步計劃是開發APP版,并將小鋼助手移動版集成到我的鋼鐵APP中。未來,公司還計劃在鋼聯數據終端中開放一個助手功能。
5、對于模型目前采取的部署方式是什么,主要就公有化和私有化進行區別?
答:公司目前主要解決內部產品問題,部署在私有云上。未來公司可能會根據行業用戶的需求,定制企業的大模型或小模型,并可能使用公有云或私有云。
6、對于模型是否已經完成備案?流程到哪一步了?
答:我們在10月份的時候提交了材料,網信辦已經給了一些優化建議。我們非常重視網信辦的建議,目前正在做對應的技術優化。
7、多模態在鋼聯的應用場景?是否有MES(生產制造管理系統)場景?
答:公司目前沒有特別針對制造核心生產場景的控制及管理系統,但產品場景是多模態的,因為數據終端產品主要面向研究類用戶,研究工作本身涉及多模態數據,如圖片識別和PDF文件信息抽取等。
公司的“小鋼”已經具備簡單的多模態能力,主要處理文字和語言類多模態數據,難度相對較低。未來公司計劃進入工業場景,多模態將更多應用于視覺方面,如鋼廠制造中的全方位數據流監控。在工業生產過程中,公司將實時轉換多模態數據流為結構化數據,輸入大模型進行分析和判斷,提供生產意見,如良品和質檢等場景。
另一方面,公司將構建大模型在前端,以對話方式與人進行更友好的交互,下達生產指令、排產計劃和設計機器人軌跡等。
鋼聯未來將進一步深入產業,介入核心生產和各系統。今天發布的EBC已與客戶的各種系統打通,實現數據價值化。例如南鋼項目,通過人工智能方式分析和處理生產經營中的數據,并提供決策支持。后續計劃是將現有模式轉變為人機交互方式,利用大模型更準確理解人的指令和意圖。
8、“小鋼”如何保證數據的準確性?以及利用公開數據的合規性?
答:對于數據的準確性,首先,使用內部的數據庫結構和業務邏輯來訓練大模型,使其能夠識別和查詢所需的數據。其次,通過反向訓練的方式,將成熟的案例訓練給大模型,并由大模型監督模型實現準確性。對于文檔的合規性,通過訓練小模型來識別語料的主題和是否包含敏感問題或錯誤,以確保使用的語料是合規的。在訓練大模型時,使用相似度較高的語料可以避免模型偏離主題。此外,引入大量已經篩選過的優質語言可以避免合規問題。此外,鋼聯擁有海量的產業大數據資源,并且積累了大量的合規能力。
這使得鋼聯在給大模型做預訓練時能夠保證數據質量,并且在引入外部數據集時能夠進行高質量或合規的篩查處置。
9、國家發改委發布關于向社會公開征求《“數據要素×”三年行動計劃(2024—2026年)(征求意見稿)》,請問公司在數據要素和人工智能結合的領域上,有什么規劃?
答:公司作為一家數商企業,我們擁有大量符合數據要素特性的有價值數據。高質量的數據能夠增強大模型的能力,而大模型也需要高質量的數據,二者相輔相成。我們將繼續利用技術手段將更多數據納入我們的數據體系,幫助政府和行業更好地沉淀數據要素的價值。同時,我們也非常重視大模型的發展,并要求研發團隊快速跟進,投入相應資源。大模型成為我們另一個重要的發展方向。我們將結合數據要素和大模型,針對行業或產業的場景進行應用開發,并支持大模型的發展和數據資產的沉淀。
10、請問公司數據資產入表什么時候開始實施?實施方法和未來增量?
答:公司已經實現數據銷售,體現數據創造價值的業務模式,根據相關準則的要求,滿足了數據資源入表四個屬性,具體包括:擁有權屬、歷史業務形成、成本可計量以及能夠帶來經濟利益的流入和管理效能的提升。根據《企業數據資源相關會計處理暫行規定》自2024年1月1日起施行,公司將按照監管要求編制2024年第一季度報告。未來公司施行《暫行規定》過程中可能存在其他不確定因素。
對于實施方法,從前期與數交所、審計機構的溝通情況來看,目前沒有相關的細則規定,但我們也在持續做相關準備工作,包括技術中心、標準化辦公室相關條線、以及管理層訪談等。未來資產入表,在知識產權保護、內部管理提升等方面都能夠帶來很大的好處。公司創立的大宗商品數據服務“八步流程工作法”具體內容涵蓋市場調研、建立樣本庫、采集與入庫、驗證與分類、數據標準化、離群值處理、數據編制及數據發布,通過上海鋼聯數據加工平臺,實現數據“生產、加工、傳輸”的全流程標準化質量管理模式,并利用統計監測系統和無監督機器學習提高數據處理的準確性。為公司未來實施數據資產入表的管理流程工作提供了保障。
關于增量,目前我們認為難度最大的是評判數據使用的壽命,即費用化的成本變成資產后如何攤銷的問題。
11、數據資產入表是按照成本法嗎?如何進行成本的分攤?
答:根據暫行規定,未來開始實施需要按照成本法、未來適用法,未來分攤方法還是要根據公司業務實際流程,協同公司技術部門、標準化辦公室以及會計師共同商討確定。
12、上海數據交易所是支持上海鋼聯來打造這個行業數據交易平臺的,那么我們在這一塊有沒有相關的一些規劃或進展?
答:公司和上海數據交易所簽署了戰略合作協議,上海數交所支持上海鋼聯建設鋼鐵行業數據交易平臺,共同推動鋼鐵行業數據流通交易,并在規范、標準、制度等方面形成共識,與上海數交所平臺互聯互通,加快構建多層次數據要素市場。未來具體實施需要看相關配套制度的落實。
(文章來源:讀創)
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。