《時代》雜志發布“2023年最佳發明”榜單,14個AI項目一覽
訊,10 月 24 日,《時代》雜志發布“2023 年最佳發明”榜單,涵蓋了如人工智能、綠色能源和可持續發展等重點領域。據悉,此次評選的標準包括獨創性、效率、影響力等,共計 200 項突破性發明(以及 50 項特別獎發明)入選,這些發明正在改變我們的生活、工作、娛樂方式,以及對可能事物的思考。
以下是?AI 領域 14 項入選發明的簡介:
1. 跳出框框自由編輯:Adobe Photoshop Generative Expand 和 Generative Fill

Adobe 通過在全球最受歡迎的圖像編輯器 Photoshop 中內置人工智能技術,讓數百萬人掌握了強大的 AI 功能。在 Adobe 的 AI 圖像生成器 Firefly 的支持下,Photoshop 現在包含了“生成擴展”(Generative Expand)和“生成填充”(Generative Fill)功能。前者允許用戶在照片的邊界之外無縫填充想象的內容。后者只需輸入一些簡單的文字,就能在現有圖像中添加或刪除內容。這兩種功能都不需要專業技術。Adobe 數字媒體高級副總裁 Ashley Still 說:這些選項使“客戶能夠以想象的速度將他們的愿景變為現實”。
2. 改變游戲規則的聊天機器人:OpenAI GPT-4

OpenAI 的 GPT-4 自 3 月份發布以來已有 8 個月,而它仍然是公眾可以使用的最強大的聊天機器人。其前身 ChatGPT 的表現僅優于 10% 參加律師資格考試的學生,而 GPT-4 的表現則超過了 90%。它擅長語言推理,能把復雜的概念分解成簡單的語言,甚至能解釋一個笑話為什么好笑。今年 9 月,OpenAI 開始推出通過語音與模型互動以及使用圖像作為輸入的功能。更新后的 GPT-4 V 在為視障人士提供工具的組織 Be My Eyes 中進行了測試,可以用自然語言口頭描述圖片內容。
3. 別出心裁的電影剪輯:Runway Gen-2

Runway 是一家由谷歌支持的初創公司,其視覺特效工具曾被用于制作奧斯卡獲獎影片《Everything Everywhere All At Once》中令人匪夷所思的畫面。6 月,Runway 推出了 Gen-2 模型。新版本允許任何人通過文字提示、圖片或其他視頻生成完整的視頻。Runway 聯合創始人兼首席執行官 Cristóbal Valenzuela 將這項新技術比作 200 年前照相機的發明。他說:“人工智能是一種新型照相機,它將永遠重塑講故事的方式,并帶來完全生成的完整故事片。”
4. 人工智能鑒定真偽:Alitheon FeaturePrint

解決價值數萬億美元的假冒商品問題的方法可能很簡單,只需將手機的攝像頭對準手表或手提包,然后讓智能軟件確定其真偽即可。FeaturePrint 是一種光學人工智能技術,它首先能“看到”實物微小的表面細節,并將其“指紋化”為獨特的數學標識。然后,只需點擊一下按鈕,它就能告訴你一件物品的真假。Alitheon 首席執行官 Roei Ganzarski 說:“不需要貼紙、標簽或標記。客戶之一是 Argor-Heraeus,該公司為各國銀行生產金條?!?/p>
5. 天空之眼:Dedrone 全城無人機探測

無人機既能帶來破壞,也能帶來益處。Dedrone 的全城無人機探測產品可在某一地理區域周圍投擲虛擬防護罩,如果無人機進入指定空域,可在數秒內向執法部門發出警告。Dedrone 跟蹤無人機發出的專有混合信號,包括無線電頻率、ADS-B 數據(也用于飛機)和 RemoteID 信標,以確定入侵位置。公司首席營銷官 Mary-Lou Smulders 將其比作無人機的空中交通管制系統,這在此前所沒有的??蛻舭?Con Edison,該公司正在用它來保護自己的基礎設施;巴塞羅那的警察部隊;以及數量不詳的機場。
6. 翻譯大師:Meta SeamlessM4T

Meta 公司將其 SeamlessM4 T 人工智能模型比作《銀河系漫游指南》中的萬能語言翻譯器巴別魚(Babel Fish)。該公司的軟件能夠從語音或文本中理解近 100 種語言,并能以語音到語音、文本到文本、語音到文本或文本到語音等多種形式實時翻譯這些語言。據 Meta 公司稱,除了可處理的語言遠多于前代產品外,該系統的效率更高,出錯率更低,甚至可以破譯同一句子中混合在一起的多種語言。Meta 已將該模型開源,這意味著全世界的研究人員都可以使用其代碼。
7. 驚人的模仿:So-VITS-SVC

今年早些時候,一位名叫 Ghostwriter 的匿名創作者創作的一首名為《Heart on My Sleeve》的歌曲引起了轟動。(這首歌很快就被合法的流媒體服務撤下,但在此之前,它已經成為了病毒式的傳播)。這些聲音是通過名為 So-VITS-SVC 的開源軟件生成的,該軟件允許技術人員對歌手的聲音進行神經網絡訓練,然后使用人工智能生成的聲音制作任何歌曲。愛好者們在 Discord 社區交換語音模型,從 Bad Bunny 到 Taylor Swift,再到 James Hatfield。與此同時,采用該軟件的用戶友好型網站也如雨后春筍般涌現。
8. AI 消防員:AlertCalifornia 和 Cal Fire AI 野火探測器

在野火蔓延之前對其進行檢測是目前困擾世界許多地區的一項挑戰。加州大學圣迭戈分校的公共安全項目 AlertCalifornia 正在利用人工智能提供幫助。該項目與加州消防局(Cal Fire)合作,訓練人工智能從遍布全州森林的 1050 多個攝像頭網絡中檢測煙霧和其他早期火災跡象。系統一旦發現異常,就會通過短信向當地消防部門發出警報。在最初的兩個月里,該系統在接到任何報警電話之前就正確識別出了 77 起火災。AlertCalifornia 的聯合首席調查員 Falco Kuester 說:“這個(系統)最大的成功案例就是那些你從未聽說過的火災?!?/p>
9. 輕松創建音樂:Stable Audio

Stable Audio 由 Stability AI 公司創建,它利用人工智能的生成能力,只需幾個簡單的文字提示,就能生成幾乎任何你想要的聲音或歌曲。(例如,輸入 "ambient techno, drum machine, peaceful, instrumental",就能生成一首輕松的新時代音樂,放在時髦的休息室里也毫不突兀)。該模型是在一個庫存音頻網站的數據集上訓練出來的(所以都是合法的),其中包含 80 多萬個音頻文件,總計 2 萬小時,可用于專業和業余項目。
10. 動物保護者:TrailGuard AI

在印度和非洲的部分地區,偷獵仍然是大象和大型貓科動物滅絕的最大威脅,即使在保護區內也是如此。美國環保組織 Resolve 創建的人工智能蹤跡保護系統(TrailGuard AI)利用英特爾(Intel)技術驅動的微型攝像頭來監控瀕危物種和發現偷獵者。該系統利用手機或遠距離無線電信號,在短短 30 秒內就能將圖像傳送到當局的手機上。TrailGuard 定制的人工智能模型經過訓練后,不僅能偵測人類,還能偵測從老虎到鬣狗等任何感興趣的物種。該技術在東非的測試階段逮捕了 30 多名偷獵者,目前正在老虎密集的印度中部進行大規模測試。
11. 畫出你的想象:OpenAI Dall-E 3

當 OpenAI 在去年 11 月向全世界發布 ChatGPT 時,它徹底改變了人工智能的格局。該公司希望 DALL-E 3(其人工智能圖像生成器的全新改進版)也能產生同樣的影響。DALL-E 3 的發明者、OpenAI 的 Aditya Ramesh 說,以前的圖像生成器需要學習一門新的技術語言,包括在字符串中添加減號和數字,才能獲得最佳效果。而 DALL-E 3 則不同,它可以折疊到 ChatGPT 中,這樣用戶就可以輸入會話命令,獲得符合其描述的圖像。
12. 聽好了:古騰堡計劃開放式有聲讀物合集

古騰堡計劃(Project Gutenberg)是歷史最悠久的數字圖書館,成立于 1971 年,旨在讓人們更容易獲得電子圖書。但首席執行官 Greg Newby 說,它“既不擅長創建,也不擅長傳播”。因此,微軟和麻省理工學院聯手制作了“開放式有聲讀物合集”,利用文本到語音技術將 5000 本圖書轉化為免費的合成旁白有聲讀物,現在可在 Spotify 上下載。推動該項目的軟件也免費發布。
13. 節拍:AudioShake

當最偉大的搖滾樂隊之一最近達成協議,在廣告中使用其 1970 年代的熱門歌曲時,其成員欣喜若狂。但有一個問題:廣告制作人只想要樂器,而樂隊擁有的只是最終的混音。因此,搖滾樂隊的團隊聯系了 AudioShake,該公司的人工智能程序可以隔離預先錄制的音頻元素,將其分解為各個組成部分?!拔覀兪挂纛l具有交互性和可編輯性,并能夠推動這些真正實用的用途,幫助藝術家賺錢,”聯合創始人兼首席執行官 Jessica Powell 說。
14. 反思智能手機:Humane Ai Pin

創辦 Humane 的兩位前蘋果公司高管設想了一個無屏幕的未來,Ai Pin 就是他們邁出的第一步。一旦輕巧的 Humane Ai Pin 通過磁力吸附在你的衣服上,它就會成為你的人工智能個人助理。該設備結合使用專有軟件和 OpenAI 的 GPT,讓您可以完成各種操作,從提出復雜的問題到撥打電話和發送短信,所有這些都只需你一聲令下即可完成。同時,內置攝像頭可以識別事物并提供上下文信息,例如食物的卡路里估值。每當 Pin 的攝像頭、麥克風或輸入傳感器處于激活狀態時,一個名為“信任燈”的顯著隱私指示燈就會亮起,以確保周圍的人都知道它在監聽或錄音。如果你需要視覺效果,一個微型投影儀會將它們直接投射到你伸出的手掌上。這款產品計劃于 11 月 9 日推出。
注:Humane 投資者包括《時代》周刊的聯合主席和所有者 Marc Benioff 和 Lynne Benioff 夫婦
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。