陶哲軒青睞的證明助手Lean,用上了大模型
現(xiàn)在,數(shù)學(xué)輔助證明工具都用上了大模型。
「我預(yù)計(jì),如果使用得當(dāng),到 2026 年,AI 將成為數(shù)學(xué)研究和許多其他領(lǐng)域值得信賴的合著者。」數(shù)學(xué)家陶哲軒在之前的一篇博客中說道。陶哲軒這樣說了,也這樣做了。他最近一直在用 GPT-4、Copilot、Lean 等工具進(jìn)行數(shù)學(xué)研究,并且還在 AI 的幫助下發(fā)現(xiàn)了自己論文中的一處隱藏 bug。在 Lean 中使用 LLM,加快數(shù)學(xué)證明速度一直以來,自動(dòng)化定理證明面臨重重困難,傳統(tǒng)上,數(shù)學(xué)證明依賴于手工推導(dǎo),需要細(xì)致的驗(yàn)證?,F(xiàn)在隨著 AI 的進(jìn)步,研究者開始借助人工智能進(jìn)行深入探索,但又免不了出現(xiàn)這種問題,即 LLM 在數(shù)學(xué)和推理任務(wù)中有時(shí)不是很靠譜,容易出現(xiàn)錯(cuò)誤和幻覺。Lean Copilot 允許用戶在 Lean 中使用大型語言模型來自動(dòng)化證明過程,從而顯著加快證明合成的速度,在必要時(shí)還允許人類無縫介入和修改,從而在機(jī)器和人類智力之間提供平衡的協(xié)作。Lean Copilot 允許在 Lean 中使用 LLM 來使證明自動(dòng)化,如策略建議(suggesting tactics)、前提(premises)以及搜索證明(searching for proofs)。用戶可以選擇使用 LeanDojo 提供的內(nèi)置模型,或者導(dǎo)入自己的模型。這些模型可以在本地運(yùn)行(無論是否有 GPU),或者在云端運(yùn)行。
簡而言之,Lean Copilot 為用戶提供了一個(gè)靈活的方式,通過引入 LLM 來增強(qiáng)和優(yōu)化在 Lean 中進(jìn)行定理證明的過程。Lean Copilot 的主要特點(diǎn)可總結(jié)為:LLM 能夠提出證明步驟,搜索證明,并從大型數(shù)學(xué)庫中選擇有用的引理。Lean Copilot 可作為 Lean 包進(jìn)行設(shè)置,并且能夠無縫地在 Lean 的 VS Code 工作流中運(yùn)行。用戶可以使用 LeanDojo 中的內(nèi)置模型,或者使用自己的模型,這些模型可以在本地(有或沒有 GPU)或云端運(yùn)行。該工具可在各種平臺(tái)上運(yùn)行,包括 Linux、macOS 和 Windows WSL。為了使 LLM 更易于 Lean 用戶使用,Lean Copilot 希望能夠啟動(dòng)一個(gè)正反饋循環(huán):證明自動(dòng)化將帶來更好的數(shù)據(jù),并最終提高 LLM 在數(shù)學(xué)上的性能。Lean Copilot 效果展示大家可以根據(jù)官方教程配置 Lean Copilot,配置好后就可以進(jìn)行實(shí)驗(yàn)了。項(xiàng)目作者也給出了一些官方示例。
- 免責(zé)聲明
- 本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。