
5個(gè)令人驚艷的AI項(xiàng)目,開(kāi)源了。。
大家好,我是 Jack。
今天清明,小伙伴們都去哪里玩了?
上個(gè)月我已經(jīng)出去浪過(guò)了,清明就老實(shí)在家歇著了。
翻看了一些最近熱點(diǎn)的開(kāi)源項(xiàng)目,發(fā)現(xiàn)還是 AIGC 的天下。
今天,我將繼續(xù)著重挑選幾個(gè)近期的優(yōu)質(zhì)開(kāi)源項(xiàng)目,相信這些項(xiàng)目對(duì)于我們的日常工作、學(xué)習(xí)生活,都會(huì)有一定的幫助。
今天整理分享給大家,希望對(duì)你有所啟發(fā)。
ChatDoctor
我相信,會(huì)有越來(lái)越多針對(duì)特定領(lǐng)域的 GPT 大模型出現(xiàn)。
各個(gè)領(lǐng)域都訓(xùn)練出一個(gè)非常專業(yè)的 GPT 大模型,到了那個(gè)時(shí)候,再加上一個(gè)上層調(diào)度模塊,一個(gè)各領(lǐng)域全能的 AI 就出現(xiàn)了。
ChatDoctor 就是醫(yī)學(xué)領(lǐng)域的一次嘗試,它是在 Meta 開(kāi)源的 LLaMA 基礎(chǔ)上 fine-tune 得到的。
ChatDoctor:你哪里不舒服?

模型一共進(jìn)行了多輪的微調(diào):
- 先使用 Stanford Alpaca 提供的 52K instruction-following 數(shù)據(jù)訓(xùn)練了一個(gè)通用的對(duì)話模型;
- 通過(guò) ChatGPT GenMedGPT-5k 和疾病數(shù)據(jù)庫(kù)生成的"患者和醫(yī)生之間的5K對(duì)話數(shù)據(jù)集",再次微調(diào)模型;
- 通過(guò) HealthCareMagic-200k 的患者和醫(yī)生之間的真實(shí)對(duì)話進(jìn)行第三輪微調(diào);
- 通過(guò) icliniq-26k 的患者和醫(yī)生之間的真實(shí)對(duì)話進(jìn)行第四輪微調(diào)。
開(kāi)發(fā)者的愿景是希望使用這些量身定制的醫(yī)患對(duì)話對(duì) LLMs 進(jìn)行微調(diào),由此產(chǎn)生的模型具有巨大的潛力來(lái)理解患者的需求,提供明智的建議,并在各種醫(yī)療相關(guān)領(lǐng)域提供有價(jià)值的幫助。

項(xiàng)目地址: https://github.com/Kent0n-Li/ChatDoctor
除了這個(gè)已經(jīng)開(kāi)源的 ChatDoctor,還有金融界的大模型 BloombergGPT。
BloombergGPT 是由全球最大的財(cái)經(jīng)資訊公司彭博社親手打造的,公司成立的 40 年時(shí)間里,收集了海量的金融市場(chǎng)數(shù)據(jù),針對(duì)金融場(chǎng)景,擁有巨大優(yōu)勢(shì)的彭博社自然不甘落后,于是開(kāi)發(fā)了這個(gè) 500 億參數(shù)的大語(yǔ)言模型 BloombergGPT。

不過(guò)這個(gè)看看就好,如果 BloombergGPT 效果真得不錯(cuò),99.99% 不會(huì)開(kāi)源,金融數(shù)據(jù)也不會(huì),畢竟這才是實(shí)打?qū)嵉摹凹夹g(shù)壁壘”。
Baize
中文名白澤,自稱可以通過(guò) chatgpt 在幾個(gè)小時(shí)內(nèi)訓(xùn)練一個(gè)你自己的 chatbot,并且只需要一張 GPU 顯卡。

目前開(kāi)源的模型有:
- Baize-7B
- Baize-13B
- Baize-30B
- Baize Healthcare-7B
- Baize Chinese-7B (Coming soon)
中文版的模型,很快也會(huì)開(kāi)源,這個(gè)項(xiàng)目還是非常值得期待一下的。

項(xiàng)目地址: https://github.com/project-baize/baize-chatbot
tomesd
tomesd 還是很有用的,簡(jiǎn)單概括它的功能就是:加速。

使用 tomesd 可以在保證圖片生成質(zhì)量的基礎(chǔ)上,大幅提升 stable diffusion 生成圖片的速度。

FID 是圖像生成質(zhì)量的評(píng)估指標(biāo),可以看到,使用 tomesd 后,SD 圖片生成速度提升了 2 倍多,內(nèi)存占用下降了5倍多,圖像生成質(zhì)量依然很高,這也算是大規(guī)模生成圖片的利器了,節(jié)省了不少的 GPU 資源和內(nèi)存資源。

項(xiàng)目地址: https://github.com/dbolya/tomesd
JARVIS
對(duì),它的中文名就是賈維斯,它就是我上文所提到的上層調(diào)度系統(tǒng)。
它能根據(jù)你的輸入,例如“請(qǐng)生成一張一個(gè)女孩正在讀書(shū)的照片,她的姿勢(shì)跟我提供的 example 圖片類似。然后再使用你的聲音描述下這張圖片?!?/p>
這個(gè)調(diào)度系統(tǒng)會(huì)根據(jù)你的輸入,自動(dòng)分析要調(diào)用哪些 AI 模型,實(shí)現(xiàn)你所說(shuō)的要求,直接調(diào)用 HuggingFace 上的相應(yīng)模型,幫你執(zhí)行完成。

好吧,現(xiàn)在“調(diào)包俠”的工作,也有 AI 幫你做了。
項(xiàng)目地址: https://github.com/microsoft/JARVIS
Text2Video-Zero
Text2Video 顧名思義,使用文本描述,生成視頻。

比如輸入:一只熊貓,在時(shí)代廣場(chǎng)彈吉他。

再比如輸入:一只可愛(ài)的小貓,在草坪上奔跑。

項(xiàng)目也在 Hugging Face 上部署了,想要體驗(yàn)的可以直接與逆行。
項(xiàng)目地址: https://github.com/picsart-ai-research/text2video-zero https://huggingface.co/spaces/PAIR/Text2Video-Zero
最后
文章的最后,再說(shuō)說(shuō)剛剛發(fā)生的事:ChatGPT 停售 Plus 會(huì)員。
官網(wǎng) Plus 升級(jí)按鈕變?yōu)榛疑牧恕?/p>
有網(wǎng)友說(shuō)這是一種營(yíng)銷手段,讓各方報(bào)道的熱度不斷。
之前我也申請(qǐng)了 GPT 4.0 的 API 接口,至今沒(méi)有通過(guò)。
再加上,ChatGPT 遭聯(lián)名封殺的事件愈演愈烈,好像一下子,全世界都燃起了一股圍剿 ChatGPT 的勢(shì)頭。
在之前的各大佬的聯(lián)名公開(kāi)信中,簽明人數(shù)已經(jīng)上升到了 9000 多人。

https://futureoflife.org/open-letter/pause-giant-ai-experiments/
上兩天,我發(fā)起了一波關(guān)于 GPT-4 的研究是否有必要暫停 6 個(gè)月的投票,這是咱們讀者的投票結(jié)果:

AI 大模型的發(fā)展,到底何去何從,拭目以待吧。