首頁(yè) > 分解

分解

  • 分解大模型的神經(jīng)元!Claude團(tuán)隊(duì)最新研究火了,網(wǎng)友:打開(kāi)黑盒

    豐色 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI神經(jīng)網(wǎng)絡(luò)的不可解釋性,一直是AI領(lǐng)域的“老大難”問(wèn)題。但現(xiàn)在,我們似乎取得了一絲進(jìn)展——ChatGPT最強(qiáng)競(jìng)對(duì)Claude背后的公司Anthropic,利用字典學(xué)習(xí)成功將大約500個(gè)神經(jīng)元分解成了約4000個(gè)可解釋特征。具體而言,神經(jīng)元具有不可解釋性

  • 奇異值分解簡(jiǎn)介:從原理到基礎(chǔ)機(jī)器學(xué)習(xí)應(yīng)用

    矩陣分解在機(jī)器學(xué)習(xí)應(yīng)用中的重要性無(wú)需多言。本文對(duì)適用范圍很廣的奇異值分解方法進(jìn)行了介紹,并通過(guò)代碼演示說(shuō)明了其工作方式、計(jì)算方法及其常見(jiàn)的幾種基礎(chǔ)應(yīng)用。矩陣分解也叫矩陣因子分解,涉及到用給定矩陣的組成元素描述該矩陣。奇異值分解(SVD)可能是最著名和使用最廣泛的矩陣分解方法。所有矩陣都有一種 SVD

  • 多模態(tài)慢思考:分解原子步驟以解決復(fù)雜數(shù)學(xué)推理

    AtomThink 是一個(gè)包括 CoT 注釋引擎、原子步驟指令微調(diào)、政策搜索推理的全流程框架,旨在通過(guò)將 “慢思考 “能力融入多模態(tài)大語(yǔ)言模型來(lái)解決高階數(shù)學(xué)推理問(wèn)題。量化結(jié)果顯示其在兩個(gè)基準(zhǔn)數(shù)學(xué)測(cè)試中取得了大幅的性能增長(zhǎng),并能夠輕易遷移至不同的多模態(tài)大模型當(dāng)中。