波士頓動力機器狗能開口聊天了!ChatGPT加持,對話機智妙語連珠
魚羊 發自 凹非寺量子位 | 公眾號 QbitAI好家伙,波士頓動力機器狗,現在能直接開口說話了。并且不同于Siri的“人工智障”,ChatGPT加持的狗,聊起天來那叫一個妙語連珠。比如隨口說一句:“我口渴了。”它會直接給你領到咖啡柜臺前,并回答:我們這里有小吃店和咖啡機。這是我們的人類同事尋找能量靈丹的地方。請隨意補充水分、給自己充能,就像我們機器人在基站里所做的那樣。
聲音聽起來非常有磁性。如果你讓它帶你見見它的“父母”,它還能在波士頓動力的展廳里,指出Spot V1給你看。
這些功能的實現,都不需要編寫特定代碼,主要是靠ChatGPT的“悟性”和視覺問答(VQA)模型、Whisper等其他一些AI模型輔助完成。
這一下子真把網友們給驚艷到了:
如何打造一只聊天機器狗具體來說,波士頓動力的研究人員提供給機器狗的,只是一個簡單腳本。給出的信息主要是公司里都有哪些房間、設施。每個房間、設施都有對應的一句話描述,比如:充電站,這是機器人充電的地方。
接著,他們讓Spot機器狗四處走動,通過攝像頭自己去觀察公司環境,并利用VQA和ChatGPT的能力為觀察到的事物打上“標記”,再把這些信息添加到腳本中。就像這樣:
這樣一番調教之下,機器狗“導游”就可以正式上崗了。既能跟游客插科打諢:
△“希望你不會因為速度太慢而跟不上機器狗的腳步”正經科普起知識來也像模像樣。重播00:39/00:39研究人員還提到,機器狗可以自如地改變“狗設”。需要做的只是在腳本里添加一句話,比如:你是一個1920年代的考古學家。像這個“詩人”Spot,就能自己作出這樣的詩句:發電機在沉悶的房間里發出低沉的嗡嗡聲。很像我的靈魂。Generator hums low in a room devoid of joy. Much like my soul.
另外,基于Spot 3.3版本自動檢測移動物體的能力,機器狗“導游”能夠感知到最近的人在哪個方向,從而把機械臂轉過去,實現“對視”交流。研究人員還用低通濾波器對生成的語音進行了處理,將其轉化為機械臂的運動軌跡,這樣一來,機器狗的行動就更靈動了。
不過,研究人員也提到,ChatGPT加持下的機器狗難免有胡說八道的時候,只是作為一名“導游”,倒也還無傷大雅。他們認為:我們很高興繼續探索人工智能和機器人技術的交叉點。這兩種技術是絕妙的搭配。機器人提供了一種在現實世界中“落地”大模型的絕佳方法。而大模型對于許多機器人任務來說都是有用的——比如,僅僅通過對話就能將任務分配給機器人,降低機器人使用的門檻。參考鏈接:[1]/uploads/pic/20231028/supported_browsers 完 —









相關推薦
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。