清華校友回國創業,獲李開復、徐小平超千萬元種子輪投資
作者 | 琰琰編輯 | 陳大鑫實習論文刷新Image世界記錄;博士畢業收割常春藤大學教職offer;入職幾個月晉升為“校長青年教授”,成為首位獲此殊榮的華人學者。這位出道即巔峰的華人學者,便是現新加坡國立大學青年教授尤洋。近日,尤洋在北京中關村創辦了一家高性能計算公司“潞晨科技”,作為高性能計算和人
作者 | 琰琰編輯 | 陳大鑫實習論文刷新Image世界記錄;博士畢業收割常春藤大學教職offer;入職幾個月晉升為“校長青年教授”,成為首位獲此殊榮的華人學者。這位出道即巔峰的華人學者,便是現新加坡國立大學青年教授尤洋。近日,尤洋在北京中關村創辦了一家高性能計算公司“潞晨科技”,作為高性能計算和人
翁荔的技術博客深入、細致,具有前瞻性,被很多 AI 研究者視為重要的參考資料。如今,她離開了 OpenAI,開啟新的征程。而且她表示,之后可能有更多時間頻繁更新博客。自從 Sam Altman 重新執掌 OpenAI 以來,該公司就陷入了持續不斷的高管離職潮中。雖然近段時間有些外部新高管加入,但很顯
編譯 |琰琰大規模深度神經網絡訓練仍是一項艱巨的挑戰,因為動輒百億、千億參數量的語言模型,需要更多的 GPU 內存和時間周期。這篇文章從如何多GPU訓練大模型的角度,回顧了現有的并行訓練范式,以及主流的模型架構和內存優化設計方法。本文作者Lilian Weng現為OpenAI應用人工智能研究負責人,
比o1 mini性能更強,價格更低,性價比新王o3-mini再次引爆AI圈熱議。在官方截圖中,中等o3-mini的性能和o1 mini差不多,價格卻只有后者的一半,整體延遲也和GPT-4o相當。最主要的,這表明了OpenAI可以在降低成本的同時提高性能。
要搞大模型AI助手,像ChatGPT一樣對齊微調已經是行業標準做法,通常分為SFT+RLHF兩步走。來自艾倫研究所的新研究卻發現,這兩步都不是必要的???新論文指出,預訓練完成剛出爐的基礎模型已經掌握了遵循指令的能力,只需要提示工程就能引導出來,引起開發社區強烈關注。因為RLHF的成本非常高訓練還不
本文圖均為 上海大學微信公眾號 圖機器人扭著“小腰”翩翩起舞,還能嫻熟地轉手絹。在中央廣播電視總臺《2025年春節聯歡晚會》上,一群穿著花棉襖的機器人一出場就把晚會氣氛拉到最嗨。這群炫酷“顯眼包”名為H1,年僅一歲半。此次春晚表演,H1團隊以獨特的“機械骨骼”形象示人,刻意營造與真人舞者的“反差萌”
一只黑嗎嘍引爆全世界,在座的都是天命人。國內首款頂級3A大作《黑神話:悟空》一上線,就創下諸多紀錄,不僅快速成為多平臺銷量榜首,Steam更是蟬聯三周冠軍,銷量已超26億元,在線玩家總人數也是屢次破紀錄。一句話總結就是:太火了太火了,簡直燒得慌~背后的開發團隊也開始受到廣大關注,結果被曝出團隊規模目
大模型【新智元導讀】GPT-4V風頭正盛,LLaVA-1.5就來踢館了!它不僅在11個基準測試上都實現了SOTA,而且13B模型的訓練,只用8個A100就可以在1天內完成。9月底,OpenAI宣布ChatGPT多模態能力解禁。多模態GPT-4V的神奇能力讓眾人驚呼:這就是GPT-4.5吧?這才沒過多
《黑神話·悟空》背后的技術供應商,亮相數博會華為云展區!還帶來了最新的動作捕捉黑科技,無需佩戴任何裝備,只用攝像頭就能給人的動作建模。此外,還有更多展商帶來了智能挖掘機、中醫大模型等一系列AI黑科技,可謂是叫人大飽眼福。下面就跟隨新火種的腳步一起看看這屆數博會上都展出了什么樣的新技術~AI黑科技亮相
西風 魚羊 發自 凹非寺量子位 | 公眾號 QbitAI馬斯克的xAI,首項公開研究成果來了!共同一作之一,正是xAI創始成員、丘成桐弟子楊格(Greg Yang)。此前,楊格就曾公開表示,自己在xAI的研究方向是“Math for AI”和“AI for Math”。其中一項重點就是延續他此前的研