首頁 > AI資訊 > 最新資訊 > 2023年最重要的3項人工智能創新:多模態AI、憲法AI和文本轉視頻技術

2023年最重要的3項人工智能創新:多模態AI、憲法AI和文本轉視頻技術

新火種    2023-12-28

站長之家12 月 22 日消息:2023 年,人工智能(AI)領域見證了重大進展,不僅公眾對 AI 有了更深的理解,政府也開始認真對待 AI 風險。本年度的發展不僅是新技術和理念的出現,更是長期孕育后的集中爆發。

OpenAI ChatGPT,人工智能,AI

以下是過去一年中人工智能領域最重要的三項創新:

多模態 AI(Multimodality) 多模態 AI 指的是 AI 系統處理各種不同類型數據的能力,不僅包括文本,還包括圖像、視頻、音頻等。今年,公眾首次獲得了強大的多模態 AI 模型的訪問權限。OpenAI 的 GPT-4 是其中的先鋒,允許用戶上傳圖像以及文本輸入。例如,用戶可以基于冰箱內容的照片詢問 GPT-4 晚餐應該做什么。9 月,OpenAI 推出了用戶通過語音以及文本與 ChatGPT 互動的功能。

憲法 AI(Constitutional AI) 憲法 AI 嘗試解決如何使 AI 符合人類價值觀的難題。2022 年 12 月,頂尖 AI 實驗室 Anthropic 的研究人員首次描述了憲法 AI,并在其 2023 年推出的聊天機器人 Claude 中使用了這一技術。該技術的核心是先撰寫一份表達期望 AI 遵循的價值觀的「憲法」,然后訓練 AI 根據憲法評分響應,并激勵模型輸出得分更高的響應。這是一種 AI 反饋的強化學習方法,與人類反饋的強化學習相比,更精確控制 AI 行為,且需更少的人類標簽。

文本轉視頻技術 文本轉視頻工具的迅速崛起是今年投入 AI 領域的數十億美元資金的顯著成果。布魯克林的 AI 視頻初創公司 Runway 的最新模型 Gen-2 允許用戶不僅根據文本生成視頻,還能根據文本提示改變現有視頻的風格。此外,另一家初創公司 Pika AI 正在使用其技術每周創建數百萬新視頻。這些免費工具試圖改變用戶生成內容的格局,可能在 2024 年發生,但由于文本轉視頻工具計算成本高,一旦風險資本用盡,它們可能開始收費。

相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章