剛剛,GPT-4o關(guān)鍵人物離職創(chuàng)業(yè)!曾在OpenAI最早提出構(gòu)建「Her」

今年 5 月份,OpenAI 發(fā)布了震驚世界的 GPT-4o。這個(gè)模型可以跨越文本、視覺和音頻,以一種非常自然的形式和人類語音對(duì)話,延遲低到與人類在對(duì)話中的響應(yīng)時(shí)間相似。而且,它允許用戶隨時(shí)打斷,并能感知和回應(yīng)用戶的情緒。因此,該模型發(fā)布后,很多人說科幻電影《Her》中的場景照進(jìn)了現(xiàn)實(shí)。
此次離職的 Alexis Conneau 就是 GPT-4o 項(xiàng)目的關(guān)鍵人物之一。離職前,他是 OpenAI 音頻 AGI 研究負(fù)責(zé)人,也是 OpenAI 最早提出 Her 愿景的人。他在領(lǐng)英的個(gè)人簡介中寫道,他是「專注于多模態(tài)和音頻 AGI 的人工智能研究員,在 OpenAI 領(lǐng)導(dǎo)了『Her』的研究(GPT4-o 和 GPT-5),這是首個(gè)原生集成音頻的 GPT 模型。」
關(guān)于離職后的創(chuàng)業(yè)方向,Conneau 還沒有透露詳細(xì)信息。但在被問及「AGI 時(shí)間表」時(shí),他回答說自己更想追求「通用情感智能(General Emotional Intelligence,AGEI)」。
Conneau 的離職帖子引起了很多人關(guān)注,相信很多 VC 已經(jīng)開始行動(dòng)了。
有意思的是,直到 Conneau 離職,他參與構(gòu)建的 GPT-4o 還沒有向全部用戶開放,目前只有部分 ChatGPT Plus 用戶可以使用(此前有消息稱今年秋季向所有 Plus 付費(fèi)用戶開放)。
同時(shí),他的離職也加重了外界的疑問:最近那么多人離職,OpenAI 到底發(fā)生了什么?
Alexis Conneau 個(gè)人經(jīng)歷
Alexis Conneau 本科畢業(yè)于巴黎綜合理工學(xué)院(法國的工程師大學(xué),在法國各類院校中常年排名第一),也在該校拿到了碩士學(xué)位。之后,他又獲得了巴黎 - 薩克雷高等師范學(xué)校的機(jī)器學(xué)習(xí)碩士學(xué)位。這一階段,他打好了數(shù)學(xué)和計(jì)算機(jī)科學(xué)的教育基礎(chǔ)。
之前有報(bào)道稱,他在巴黎綜合理工學(xué)院學(xué)習(xí)的是純數(shù)學(xué),并且他喜歡思考數(shù)字。而當(dāng)時(shí),科技行業(yè)已經(jīng)將數(shù)字游戲變成了一種價(jià)值數(shù)十億美元的藝術(shù)形式。所以當(dāng)他畢業(yè)時(shí),他選擇了科技。
2015 年,Conneau 加入了 Facebook 在巴黎的新人工智能實(shí)驗(yàn)室。該實(shí)驗(yàn)室是在美國頂尖科技巨頭的全球擴(kuò)張行動(dòng)中成立的:每個(gè)人都想在全球最有才華的研究和工程專業(yè)學(xué)生畢業(yè)前將他們招攬過來。2019 年,Conneau 拿到了他的博士學(xué)位。
之后,Conneau 先后在 Facebook AI Research 、谷歌和 OpenAI 工作,并在文本和語音神經(jīng)網(wǎng)絡(luò)領(lǐng)域做出過重要貢獻(xiàn)。
他的主要成就如下:
在 OpenAI 通過 GPT-4o 創(chuàng)建了第一個(gè)版本的「Her」。Conneau 表示,是他將這一愿景帶到了 OpenAI,并與一位同事合作,(幾乎)從零開始構(gòu)建了這個(gè)音頻 LLM 研究。
創(chuàng)建了首個(gè)能夠在沒有任何監(jiān)督的情況下翻譯文本和轉(zhuǎn)錄語音的神經(jīng)網(wǎng)絡(luò)(無監(jiān)督 MT 和 ASR)。
為文本和語音構(gòu)建了通用的多語言掩蔽語言模型表示(XLM-R、Wav2vec 2.0 XLS-R)。
在 Meta 和谷歌推廣這些語言模型表示,通過文本分類、機(jī)器翻譯和語音識(shí)別等各種應(yīng)用影響了 10 億用戶。
發(fā)現(xiàn)了「零樣本跨語言遷移('zero-shot cross-lingual transfer)」的概念,證明多語言語言模型在單一語言上經(jīng)過微調(diào)后,可以在其他語言上有效運(yùn)行(XNLI、XLM)。
開源 Facebook AI Research 最受歡迎的基礎(chǔ)文本和語音掩蔽語言模型(XLM-R 和 Wav2vec 2.0 XLS-R),可在 Hugging Face 上獲取。
此外,他還曾在 EMNLP(2017 年、2018 年)和 SLT(2022 年)上獲得最佳論文獎(jiǎng),并在 JMLR、NeurIPS 和 ICML 等頂級(jí)期刊和會(huì)議上發(fā)表過論文。他的工作極大地增強(qiáng)了服務(wù)于數(shù)億人的文本和語音系統(tǒng)。
三年前,《華盛頓郵報(bào)》為他寫過一篇專題文章。
報(bào)道鏈接:
關(guān)于 Conneau 新公司的信息,我們將跟進(jìn)報(bào)道,敬請(qǐng)期待。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。