500行代碼打造AI搜索引擎!登頂GitHub熱榜
只用500行代碼搭出來的AI搜索引擎,登頂GitHub趨勢榜。
作者:賈揚清的LeptonAI團隊。
Lepton Search耗時一個周末打造,僅作為Demo演示而不是正式產品,只為向開發者展示“天下沒有難構建的AI應用”。
△能理解中文但用英文回答
賈揚清事后感慨到:
這件事并沒有那么復雜——我們剛開始時確實以為會更難。
另外,圍繞這個Demo還發生了一些爭議。
AI搜索引擎Perplexity創始人認為其參考了自己產品的UI界面,轉發評論了一番。
賈揚清也做出回應,稱無意進入這個市場,更多的是Demo展示以及宣傳自家LeptonAI云服務,并且一開始就準備開源。
總之,兩位大佬“友好”地一番交鋒之后,Lepton Search修好bug后立即開源并且迅速獲得社區認可。
目前,已有偏學術的開源AI搜索引擎SciPhi使用賈揚清的代碼完成升級。
500行代碼的AI搜索引擎
要注意,AI搜索引擎整體上依然是一個復雜的項目。
Lepton Search之所以500行代碼就能實現,正如賈揚清想要展示的,是因為今天的應用開發已經高度模塊化:
-大模型,調用了在自家云上部署的開源Mixtral-8x7b模型。
-搜索引擎,目前用了必應搜索的API。
-數據存儲,用自家Lepton KV作為無服務器存儲。
這500行代碼其實只做到以下幾點,就完成一個產品的雛形了:
對大模型和搜索引擎的接口支持
前端UI界面
可緩存和可分享的搜索結果
除此之外,賈揚清還分享了開發過程中學到的一些經驗:
-搜索質量確實非常重要,好的結果片段才能產生好的摘要。
-一點AI幻覺其實有助于填補片段中未涉及的“常識”。
-開源模型在文本摘要任務上已經做的非常好。
在后續與網友討論過程中,賈揚清還認為“AI對話式搜索不會取代傳統搜索”,還需要依賴傳統搜索引擎的結果。
事實上,AI搜索目前正是行業的一個大熱門方向。
代表公司正是前面提到的Perplexity,剛剛拿到7360萬美元的A輪融資,估值超過5億美元。
投資者中有英偉達、亞馬遜,甚至谷歌AI大佬Jeff Dean和前YouTube CEO也不避嫌,以個人名義參與投資。
并且Perplexity已和部分瀏覽器廠商如Arc展開合作,成為默認搜索引擎的選項之一。
△Perplexity網頁版
更小一些的創業項目方面,比如面向程序員的devv_,面向學術的Consensus也各自受到垂直用戶群體的認可。
國內大廠也是AI搜索的積極參與者,百度除了以文心一言插件的形式集成了AI搜索之外,還推出了獨立的簡單搜索App試水。
360也推出360AI搜索獨立APP版,安卓版剛剛上線還是熱乎的,連評分數量都還沒夠展示門檻。
昆侖萬維的天工AI搜索則已推出了將近半年,其首頁推薦問題通常緊追最新熱點,很方便吃瓜。
AI搜索類產品在設計上大致分為三大類。
谷歌和百度在傳統搜索的頁面頂部,以卡片形式展示AI生成結果。
必應、百度文心一言更偏重對話,搜索結果由AI總結提煉后呈現在多輪對話中。
其他產品大多遵循Perplexity為代表的新范式:
-搜索結果頁面分為“參考鏈接-AI回答-相關追問”幾個模塊,并可多輪提問。
-搜索結果有歷史記錄,且可以對外分享。
-Copilot增強模式,AI理解問題后反向提問,引導用戶補充搜索條件。
-個性化提示詞,用于調整AI回答的風格以及格式。
正如Perplexity的CEO所說,他們的產品大獲成功后,其模式已成為事實上的行業標準。
除了宏觀的界面、功能之外,更細節之處如“付費功能的免費使用次數”都被一些后來者學走。
- 免責聲明
- 本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。