首頁 > AI資訊 > 行業動態 > 谷歌發布視頻生成模型VideoPoet;AI機器人在迷宮游戲中超越人類;智源FlagEval大模型12月榜發布

谷歌發布視頻生成模型VideoPoet;AI機器人在迷宮游戲中超越人類;智源FlagEval大模型12月榜發布

新火種    2023-12-28

1、谷歌發布零樣本視頻生成模型VideoPoet

今日,谷歌于官網宣布推出用于零樣本視頻生成的大型語言模型VideoPoet。該模型能夠完成多種視頻生成任務,包括文本到視頻、圖像到視頻、視頻風格化、視頻修復、視頻擴張以及視頻到音頻。該模型采用的方法在單個大模型中無縫集成了多種視頻生成功能,而不是依賴于專門針對每項任務的單獨訓練組件。

2、谷歌將AI代碼輔助功能擴展到所有Colab用戶

今日,谷歌于官網宣布將AI代碼輔助功能擴展到所有Colab用戶,包括免費用戶,現已在175個地區推出。Colab是谷歌提供的一個在線工作平臺,可以免費使用GPU進行深度學習,支持Jupyter Notebook和代碼執行程序。

3、谷歌將在美國總統大選前限制選舉相關AI檢索

據路透社報道,谷歌于當地時間周二宣布,在2024年美國總統大選之前,它將限制其聊天機器人Bard和搜索生成體驗所能返回的與選舉有關的查詢類型,這些限制將于2024年初開始實施。

4、微軟Copilot引入音樂生成功能

今日,微軟于官網宣布與AI音樂創作公司Suno合作,以插件形式將其功能引入微軟Copilot,使用戶可以通過簡單的提示輕松創作有趣、巧妙和個性化的歌曲。

5、亞馬遜云科技自研芯Graviton3實例落地中國

12月15日,亞馬遜云科技宣布,通過與光環新網和西云數據的緊密合作,其在亞馬遜云科技北京區域和寧夏區域推出基于自研芯片Amazon Graviton3處理器的Amazon Elastic Compute Cloud(Amazon EC2)M7g通用型、C7g計算優化型和R7g內存優化型三款實例。這些實例均基于Amazon Nitro System構建,與采用Amazon Graviton2的實例相比,整體性能提升高達25%,內存帶寬提升50%,同時能耗更低,能效提升高達60%。其中,M7g實例適用于如應用程序服務器、微服務、游戲服務器等,C7g 實例適用于如高性能計算、視頻編碼、游戲和基于CPU的機器學習推理加速等計算密集型應用程序,R7g實例適用于如開源數據庫、內存緩存和實時大數據分析等內存密集型工作負載。

6、亞馬遜的AI評論摘要被認為夸大負面反饋

據彭博社昨日報道,亞馬遜的AI商品評論摘要功能有時會提供不準確的產品描述,或是夸大負面反饋。一些商家稱,這些摘要是在他們即將進入關鍵的假日購物季時部署的。彭博社審查了數十篇評論摘要發現,AI在分析顧客評論和生成評論摘要時并不一致,有的突出了批評性反饋,有的則沒有。

7、AI機器人在迷宮游戲中超越人類

據彭博社報道,蘇黎世聯邦理工學院的研究人員創造了一個名為CyberRunner的AI機器人,其在迷宮游戲Labyrinth中的表現超過了人類。據稱,該機器人通過傾斜表面使一個小金屬球穿過迷宮,避開棋盤上的洞,僅用了六個小時就掌握了這個玩具。相關論文于當地時間周二發布,介紹了其建立在基于模型的強化學習領域的最新進展之上的模型,讓AI通過試錯來學習如何在動態環境中行動。該項目現已開源發布,用戶可支付200美元以使用CyberRunner平臺協調大規模實驗。

8、百度智能云千帆AppBuilder開放服務

今日,百度智能云宣布,AI原生應用開發工作臺——千帆AppBuilder全面開放服務。據了解,AppBuilder提供兩種產品形態,代碼態與低代碼態。對于有深度AI原生應用開發需求的用戶,AppBuilder代碼態提供包括SDK、開發環境、調試工具、示例代碼等各種開發套件和應用組件;而AppBuilder低碼態則提供可視化工具,用戶只需簡單點選,即可快速定制、上線AI原生應用。

9、智源FlagEval 12月榜發布,新增魯棒性評測

據智源研究院微信公眾號發文,今日,FlagEval大語言模型測評榜單12月榜發布,本期榜單新增大語言模型魯棒性評測結果,考察模型對于輸入文本的抗干擾能力;FlagEval平臺更新了C-SEM v2.0數據集評測結果,新增了最新開源的Qwen-72B/1.8B、DeepSeek-67B(Base)模型評測。其中,Qwen-72B-Chat模型主觀評測結果大幅領先,準確率達83.6%。

據悉,北京航空航天大學與智源FlagEval團隊共同構建了大語言模型魯棒性評測方案,并針對當前主流模型進行了初步評測,本期魯棒性評測數據集和評測結果分為兩個部分:內容擾動魯棒性評測(北京航空航天大學構建),針對選擇問答、文本分類、代碼生成任務下的MMLU、OCNLI、CSL、HumanEval測試集進行字符(Char)、單詞(Word)、句子(Sentence)三個級別進行內容擾動以及對抗性擾動(即采用代理模型和相關算法進行對抗性攻擊),生成了不同的擾動數據集;格式擾動魯棒性評測(智源FlagEval團隊構建),基于MMLU_Chinese、MMLU、Gaokao2023_v2.0數據集,進行選項格式擾動,考察模型是否真正理解了問題和選項并遵從指令的格式要求作答。例如,四個選項的內容調換順序,或者將A、B、C、D改為B、D、C、E。

10、摩爾線程首個千卡智算中心落地

據摩爾線程微信公眾號發文,昨日,摩爾線程首個全國產千卡千億模型訓練平臺——摩爾線程KUAE智算中心揭幕儀式在北京成功舉辦,宣告國內首個以國產全功能GPU為底座的大規模算力集群正式落地。同時,摩爾線程CEO張建中發布了大模型智算加速卡MTT S4000、專為千億參數大模型訓練和推理提供強大支持的摩爾線程KUAE平臺。據悉,摩爾線程KUAE支持包括DeepSpeed、Megatron-DeepSpeed、Colossal-AI、FlagScale在內的業界主流分布式框架,并融合了多種并行算法策略,包括數據并行、張量并行、流水線并行和ZeRO,且針對高效通信計算并行和Flash Attention做了額外優化。

11、港中大團隊開源AI音頻工具包Amphion

12月18日,香港中文大學(深圳)武執政副教授帶領的團隊聯合上海AI實驗室等開源了音頻、音樂和語音生成工具包Amphion v0.1版本。除了文字轉語音功能,Amphion還可以將一首歌的聲音換成另一個歌手的聲音,支持聲音轉換、歌聲合成、文本到音頻、文本到音樂等功能,歌聲轉換目前支持邁克爾·杰克遜、泰勒·斯威夫特、王菲、那英、李健等歌手的聲音。該工具包支持多種模型和架構,如FastSpeech2、VITS、Vall-E、NaturalSpeech2等,用于不同的音頻生成任務。

12、CMU研究稱Gemini Pro不如GPT-3.5 Turbo

據VentureBeat報道,昨日,卡內基梅隆大學(CMU)和BerriAI的研究人員共同發表了一篇論文,將谷歌的Gemini Pro模型與OpenAI的GPT-3.5 Turbo、GPT-4 Turbo以及Mistral AI的Mixtral 8x7B進行了測試對比,通過一組不同的提示運行所有模型,包括向他們詢問57個不同的多項選擇題,涉及STEM、人文科學、社會科學等方面的內容。測試結果顯示,Gemini Pro得分在十幾個數據集的測試上表現都不如GPT-3.5 Turbo。研究人員還發現,當提示不同的模型在標記為A、B、C或D的答案之間進行選擇時,Gemini選擇“D”的次數比其他模型不成比例地多,無論它是否是正確的答案。

13、蓋茨:距美國大眾廣泛使用AI還有18到24個月

比爾蓋茨昨日發布年度展望博客,其中談道:“如果讓我做個預測,在美國這樣的高收入國家,我猜離普通民眾大量使用AI還有18-24個月的時間。而在非洲國家,我預計在3年左右的時間里,AI的使用就會達到相當的水平。這仍然是一個差距,但比我們在其他創新中看到的滯后時間要短得多。”他還提到,希望AI在抗生素藥物、個性化教育、高危妊娠治療、艾滋病風險評估、醫療信息獲取等方面能夠得到更廣泛的應用。

14、NewsGuard:全球AI虛假新聞網站已達614個

新聞數據集網站NewsGuard昨日發布報告稱,迄今為止,NewsGuard的團隊已識別出614個不可靠的AI生成的新聞和信息網站,涵蓋15種語言。相比今年4月的49個,虛假新聞網站的數量增加了1153%。這些網站大多使用一些諸如“商業日報”(iBusiness Day)、“愛爾蘭頭條新聞”(Ireland Top News)、“每日時事更新”(Daily Time Update)等看似權威的名稱,對于消費者來說難以辨認。這些網站發布的文章涉及政治、技術、娛樂和旅游等主題,包含名人死亡騙局、捏造事件以及將舊事件描述為剛剛發生等虛假內容。

15、《出版業生成式人工智能技術應用指南》發布

今日,中國音像與數字出版協會發布關于發布團體標準《出版業生成式人工智能技術應用指南》的公告,該指南經立項審核、標準起草、征求意見、專家組審查等程序,并通過團標委審查,現予以批準發布。標準編號為T/CADPA 47-2023,自2024年1月20日起開始實施。

16、輕松集團自研大模型升級 發布七大AI+健康應用

據醫療健康企業輕松集團微信公眾號發文,12月19日,輕松集團旗下醫療健康服務平臺輕松健康,宣布其自研的垂直領域大模型“輕松問醫Dr.GPT”全面升級。同時,輕松健康還發布了基于該大模型研發七大應用,以滿足不同應用場景及用戶群體的特定需求,包括“智能問診系統”“個性化健康管理顧問”“慢性病管理計劃”“心理健康指導師”“醫學知識庫和技能培訓平臺”“輔助診療助手”“患教內容智創平臺”,覆蓋健康管理服務全場景應用。

17、AI創企安安創新完成1500萬天使輪融資

據36氪昨日報道,AI創企安安創新近期完成一輪近1500萬元天使輪融資,投資方為個人股東。據悉,安安創新是一家企業服務賽道的創業公司,創立于2021年,公司主要面向民營企業服務,針對企業的“治理、管理、金融、財稅、法律”5個維度難題,通過大模型等AI工具進行智能診斷,結合自主知識圖譜+專家知識庫,輸出專業解決方案。

18、荷蘭地圖平臺TomTom與微軟合作打造車載AI助手

據路透社報道,荷蘭數字地圖平臺TomTom于當地時間周二宣布,將與微軟合作打造一款基于AI的車輛對話助手。該助手將允許用戶通過自然語言與車輛交談,并實現與信息娛樂、位置搜索和車輛命令系統的語音交互。TomTom稱,該語音助手可以集成到其他汽車信息娛樂系統中,也可以內置到TomTom的數字駕駛艙中,是一個開放的模塊化車載信息娛樂平臺。

19、荷蘭數字金融公司Bunq推出AI聊天機器人

據彭博社今日報道,荷蘭數字金融公司Bunq推出一款AI聊天機器人Finn,支持用戶查詢自己的支出信息。Finn建立在現有大型語言模型之上,并利用客戶在Bunq平臺上的消費信息進行訓練,由十幾名數據專家歷時一年構建。

20、藥品連鎖店因濫用AI人臉識別被FTC起訴

據彭博社報道,美國聯邦貿易委員會(FTC)在當地時間周二提交給聯邦法院的一份訴狀中稱,藥品連鎖巨頭Rite Aid在紐約、洛杉磯、巴爾的摩等城市的門店使用了AI面部識別系統,但沒有通知顧客。據該機構稱,Rite Aid的面部識別系統產生了數千個不正確的識別,通常涉及黑人、拉丁裔或女性。由于匹配不當,Rite Aid員工會在商店周圍跟蹤顧客、報警,有時甚至謊稱顧客入店行竊。作為與聯邦貿易委員會和解的一部分,該連鎖店同意在未來五年內不使用面部識別技術進行監控,刪除迄今為止收集的圖像,并向聯邦貿易委員會提供有關其合規情況的年度報告。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章