失語近20年后,她在AI幫助下再次說話
圖片來源:PHOTO COURTESY OF NOAH BERGER, UCSF
一位癱瘓的女士憑借一小塊植入大腦的電極片和由美國加利福尼亞州的科學家開發的數字虛擬形象,能夠再次開口說話。
這是人類第一次將從大腦信號中捕捉的語言和表情用虛擬形象表達出來,而且虛擬形象可以用患者自己的聲音說話。
這是美國加州大學舊金山分校(University of California San Francisco)的愛德華·F·張博士實驗室(Dr. Edward F. Chang Lab)的第四年博士生凱羅·利特爾約翰的觀點。他還是8月23日在《自然》雜志(Nature)發表的詳細介紹該項目的論文的主要作者。
這位47歲的女性患者名為安,18年前的一次腦干卒中令她失去了說話能力。安同意通過外科手術在她的大腦皮層植入一塊像紙一樣薄、信用卡大小的電極片,共有253個電極。這些電極能夠獲取這個區域的信號,并傳達到舌頭、下顎、喉嚨和面部,這些部位在正常情況下會形成語言和面部表情。一條線纜插入頭顱上的一個端口,把這些電極連接到幾臺安裝了人工智能驅動系統的電腦。
安與利特爾約翰的團隊共同用幾周時間,訓練人工智能系統,使其可以識別她的電腦發出的獨特信號,并轉換成語音。這需要她在大腦中重復會話詞匯表里的1,024個單詞組成的短語。
利特爾約翰說:“安非常投入,也很努力。她愿意根據需要進行長時間錄制,而且她很清楚她的努力將創造一種語言神經假體,會讓有這方面殘疾的許多人受益?!?/p>
在完成系統訓練后,安的思想被轉換成口頭信息,由一個虛擬形象表達出來,這個虛擬形象使用根據幾年前拍攝的婚禮視頻重構的安自己的聲音。
利特爾約翰見證了安首次使用這個系統。一臺計算機化輔助與替代通信(AAC)設備讓她能夠通過頸部肌肉移動,緩慢費力地進行有限的溝通。除此之外,這是她近20年來首次可以出聲說話。
利特爾約翰對《財富》雜志表示:“對我和她而言,這是一個非常暖心的時刻,令我們備受鼓舞。”
他補充道,對安來說,“能夠聽到自己的聲音是一次激動人心的經歷?!?/p>
因為系統經過訓練可以識別39個音素,即單詞的子單位,而不是完整的單詞,因此它將解讀安的思想的速度提高了三倍,把大腦信號轉換成文本的速度約為每分鐘80個單詞。
協助開發解碼器的生物工程學研究生肖恩·梅茨格在有關該項目的新聞稿中稱:“準確性、速度和詞匯是關鍵。這些因素保證用戶幾乎能夠像正常人一樣快速溝通,可以進行更自然、更正常的對話?!?/p>
加州大學舊金山分校的神經外科系任愛德華·F·張希望該系統能夠很快供類似患者連續使用。由于該設備目前仍然在臨床試驗階段,因此安無法在研究以外的場合使用。張領導的團隊之前曾經幫助一位腦干卒中的男性,通過將大腦信號轉換成文本進行溝通。
他在新聞稿里說:“我們的目標是恢復充分的、具象化的溝通,讓用戶可以用最自然的方式與他人對話。這些技術的進步令我們向真正解決患者的需求邁出了一大步?!?/p>
利特爾約翰表示,不同于現有版本,這款產品要在安和其他類似患者的日常生活中應用,必須采用無線設計,并且體積更小巧,以便于攜帶。他希望在最多十年內就能夠開發出更完善的版本,并且可以獲得美國食品與藥品管理局(U.S. Food and Drug Administration)的批準。
另外一項腦機接口研究
安試驗的系統是一種腦機接口。這類技術能夠用于癱瘓患者表達自己的思想,例如已故的史蒂夫·霍金,只是這個系統的語音不像機器人一樣呆板,而且只要根據用戶的思考就可以轉換成語音。
美國加州大學伯克利分校(University of California Berkeley)的研究人員在今年8月的早些時候公布了一項相關研究成果,并在《PLoS生物學》雜志(PLoS Biology)上發表了論文。
外科醫生在位于紐約的奧爾巴尼醫療中心(Albany Medical Center)在29位癲癇病患者的大腦內植入電極,當時手術室里播放的是平克·弗洛伊德樂隊(Pink Floyd)的歌曲《迷墻中的另一塊磚(第一部分)》(Another Brick in the Wall, Part 1)。通過人工智能,研究人員能夠根據每一位患者大腦中的電子活動重現這首歌曲。
心理學和神經學教授羅伯特·奈特博士最近告訴《財富》雜志,這項成果將被用于開發更完善的腦機接口,用于幫助癱瘓患者、肌萎縮側索硬化癥(ALS)患者和失語癥等語言障礙患者。失語癥是指患者無法做出講話的必要動作。
隨著技術日益完善,最終它或許可以通過頭皮電極來表達用戶的想法。加州大學伯克利分校的人類認知神經學博士后研究員、論文的主要作者盧多維克·貝利耶對《財富》雜志表示,這類電極目前能夠用于表達一個人從一串字母里做出的選擇,但識別每個字母的時間至少需要20秒,因此將這種技術用于溝通非常不便。
如果該技術經過簡化,最終就可以協助非殘疾人士,比如腦力工作者,與計算機同步傳達他們大腦中的文本。
貝利耶指出:“關鍵是減少阻滯,使人們能夠用心中所想完成行動?!崩纾骸澳憧梢栽诖竽X中想:‘叫輛Uber網約車’,然后在你還沒有完成手頭的事情的時候,就會有網約車來接你。”
有人對這項研究的未來應用感到不安,對此,奈特和貝利耶強調,目前這種操作必須通過外科手術才能夠完成。他們表示,把大腦信號轉換成語音的人工智能“只是類似于為大腦提供了一個鍵盤”。
關于可能出現的隱私問題,貝利耶稱,他更擔心大型科技公司目前通過監控和跟蹤在線活動,對我們的了解程度。
此外,他認為隱私問題可以解決。在完成患者的無線腦電圖掃描后,信號將被加密。
貝利耶說:“許多事情尚處在開端,比如神經科學和計算機工程的融合,而且在許多方面,這些技術前途無限。”
奈特補充道:“我認為我即將揭開整個故事的謎團?!保ㄘ敻恢形木W)
譯者:劉進龍
審校:汪皓
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。