首頁 > AI資訊 > 最新資訊 > 為便利老人提供新可能,上海大學研發的滬語大模型迎來2.0版

為便利老人提供新可能,上海大學研發的滬語大模型迎來2.0版

新火種    2025-04-29

由上海大學團隊研發的滬語大模型“小滬”迎來2.0版,為助老服務提供更多可能。

3月10日,在上海大學主辦的“當上海話遇到大模型——助力上海城市數字化轉型”研討會上,大模型“小滬”聲情并茂地朗讀了一段《再別康橋》,平仄腔調甚有韻味。當現場嘉賓向小滬拋出問題“上海是個什么樣的城市”“上海話中的‘大小姐’和‘小大姐’,你曉得有什么區別嗎”時,“小滬”在短暫思考后,給出了一段段準確且略顯俏皮的語音回答。

活動現場小滬吟誦《再別康橋》。澎湃新聞記者 鞠文韜 圖

澎湃新聞(www.thepaper.cn)記者了解到,“小滬”于2024年11月9日由上海大學中文學科團隊發布,專注聽、說、讀,能夠開展滬語朗讀和普通話朗讀,普通話-滬語自由對話等。經歷迭代,如今2.0版本的“小滬”實現了滬語與滬語之間的自由交流,并開發出女聲滬語、男聲滬語、童聲滬語等不同性別和年齡的滬語版本,也具備包括英文、日語、韓語、德語在內的七種外語能力。

現場嘉賓與“小滬”對話。

上海大學文學院博士研究生范天玉介紹了大模型開發過程中的曲折與突破:“大模型開發的三要素是算法、算力和數據集。我們在訓練中遇到的最大困難就是數據集的問題,因為方言大部分是口頭表達,文本數據較少,而大模型需要輸入文字符號,且七大方言區中,吳語使用人口也是最少的。此外,上海話在語音、詞匯和語法系統上呈現出明顯的層次性特征,也是建立高質量數據集的難點之一。上海大學雖然有豐富的原始語料,但要轉化為可用于人工智能訓練的格式,仍需大量人力物力。”

范天玉表示,研發團隊計劃將“小滬”做成端到端大模型,而非純粹的語言模型,因此需要的計算成本會更高。后續會繼續優化訓練數據集與算法,優化端到端的數字人響應速度,提升語音合成的情感表達能力,實現更接近真人、更生動化的表達。

“我們希望小滬不是冰冷的AI系統,而是像真正的上海爺叔、上海囡囡一樣去講話。提高小滬的情感表達能力,是為了讓老年人能感受到在和一個具有生命力、有情感共鳴的生命體在交互。未來將盡快發布端到端大模型,讓每個人都可以接入,讓小滬真實參與到城市治理、助老服務之中,希望幫助不習慣或不擅長使用普通話的老年人群體能夠流暢交流,以上海話大模型補齊上海城市數字治理的拼圖。”上海大學黨委常委、宣傳部部長曾軍說。

活動現場,上海大學校黨委副書記段勇表示,“小滬”的誕生,是上海大學在服務上海城市數字化轉型方面的一次積極嘗試,也是在新一代人工智能技術與傳統文化融合方面的有益探索。未來,學校將深化“小滬”的建設和應用,充分利用“自強5000”超算中心、“千學百科”AI智慧平臺等技術資源,為“小滬”的訓練、優化和應用提供堅實的技術支撐,讓“小滬”成為上海城市數字化轉型中的鮮活創新案例。

此外,3月10日也是上海大學海派文化研究中心一年一度組織策劃的“310-與滬有約”海派文化日。上海大學海派文化研究中心主任、上海市委宣傳部原副部長陳東在活動中表示,上海話承載著上海人民的集體記憶和獨特情感,保護和開發上海話不僅是為了保留一種語言形式,更是為了傳承一份文化基因,踐行城市精神。在數字化轉型的浪潮中,“小滬”的研發正是為了探索上海話在現代社會中的新應用,成為連接過去與未來的橋梁。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章