首頁 > 資源庫 > 開源項目 > 推薦:35個熱門又實用的開源 AI 項目!

推薦:35個熱門又實用的開源 AI 項目!

2023-10-27

2017年企業界在AI技術上的開支將達到125億美元,比2016年增長逾59.3%。這股強勁的增長勢頭可能會一直持續到2020年,到時收入有望達到460億美元。開源軟件的發展為AI的崛起發揮了巨大作用,市面上許多頂級的機器學習、深度學習、神經網絡及其他AI軟件采用開源許可證。本文從中遴選了50個最著名的開源AI項目:

1. ACT-R:ACT-R由卡內基·梅隆大學開發,它既是人類認知理論的名稱,又是基于該理論的軟件的名稱。該軟件基于Lisp,提供詳細的說明文檔。

鏈接:http://act-r.psy.cmu.edu/software/

2. Caffe:Caffe最初由加州大學伯克利分校的一名博士生創建,已成為一種大受歡迎的深度學習框架。它賴以成名的方面包括富有表現力的架構、可擴展代碼和速度。

鏈接:http://caffe.berkeleyvision.org/

3. CaffeOnSpark:該項目最初在雅虎開發而成,將Caffe深度學習框架引入到Hadoop和Spark集群。它用于圖像搜索和內容分類以及其他使用場合。

鏈接:https://github.com/yahoo/CaffeOnSpark

4. ConvNetJS:這個JavaScript庫讓用戶可以從瀏覽器來訓練深度學習模型。它承諾“無軟件要求、無需編譯器、無需安裝、無需GPU、無需流汗水。”

鏈接:http://cs.stanford.edu/people/karpathy/convnetjs/

5. DeepDetect:DeepDetect被空中客車和微軟之類的企業組織所使用,它是基于Caffe、TensorFlow和XGBoost的開源深度學習服務器系統。它為圖像分類、對象檢測、文本及數字數據分析提供了一套易于使用的API。

鏈接:https://deepdetect.com/

6. Deeplearning4j:Deeplearning4j聲稱是“為Java和Scala編寫的第一個商業級開源分布式深度學習庫。”通過Skymind提供商業支持。

鏈接:http://deeplearning4j.org/

7. DSSTNE:DSSTNE的全稱是“深度可擴展稀疏張量網絡引擎”,它是亞馬遜用來訓練和部署其推薦引擎的軟件庫。主要功能包括:多GPU規模、大層次以及可處理稀疏數據集。

鏈接:https://github.com/amzn/amazon-dsstne

8. H2O:H2O擁有10多萬用戶,聲稱是“世界領先的開源深度學習平臺。”除了開源版本,該公司還供應提供付費支持的高級版。

鏈接:http://www.h2o.ai/

9. 微軟認知工具包:微軟認知工具包以前名為CNTK,承諾可訓練深度學習算法,像人腦那樣思考。它擁有速度快、可擴展性、商業級質量以及與C++和Python兼容等優點。微軟使用它來支持Skype、Cortana和必應(Bing)中的AI功能。

鏈接:https://www.microsoft.com/en-us/cognitive-toolkit/

10. Theano:Theano適用于深度學習,自稱是“一種Python庫,讓你可以高效地定義、優化和評估涉及多維數組的數學表達式。”主要功能包括GPU支持、與NumPy整合、高效的符號微分法、C代碼動態生成等更多功能。

鏈接:http://www.deeplearning.net/software/theano/

11. DeepMind Lab:DeepMind Lab旨在用于AI研究,它是一種3D游戲環境。它由谷歌的DeepMind部門開發而成,據說尤其適用于深度強化學習研究。

鏈接:https://deepmind.com/research/publications/deepmind-lab/

12. Project Malmo:Project Malmo是微軟領導的項目,使用游戲《我的世界》作為AI研究平臺。據官網聲稱:“《我的世界》對人工智能研究而言很理想,這跟它吸引著每天進入其虛擬世界的成千上萬粉絲是同一個道理。不像其他電腦游戲,《我的世界》為用戶提供了無窮無盡的可能性,從簡單任務(比如一路尋寶)到復雜任務(比如與一群隊友搭建建筑物),不一而足。”

鏈接:https://www.microsoft.com/en-us/research/project/project-malmo/

13.《星際爭霸II》API庫:谷歌的DeepMind和暴雪娛樂公司在共同開展一個項目,可使用《星際爭霸II》視頻游戲作為AI研究平臺。它是一種跨平臺的C ++庫,可用于構建腳本化的機器人程序。

鏈接:https://us.battle.net/forums/en/sc2/topic/20758616786

14. Stockfish:這個開源國際象棋引擎是世界上最好的引擎之一,可擊敗大多數人類大師。請注意:它還有一個移動應用程序。

鏈接:https://stockfishchess.org/

15. XGBoost:XGBoost支持梯度提升樹,這是一種易于訓練的決策權,提供了神經網絡之外的一種選擇。它支持回歸、分類、排序及其他類型的算法。

鏈接:http://xgboost.readthedocs.io/en/latest/

16. Numenta:Numenta組織提供了與層級實時記憶(HTM)有關的眾多開源項目。實際上,這些項目試圖基于生物界對于人類新大腦皮層的了解來生成機器智能。

鏈接: http://numenta.org/

17. Open Cog:Open Cog不是專注于AI的狹窄方面,比如深度學習或神經網絡,旨在生成有益的強人工智能(AGI)。該項目正致力于打造能夠擁有類人智能的系統和機器人。

鏈接:http://opencog.org/

18. Accord.NET框架:Accord.NET承諾機器學習可在“1分鐘內搞定”。它基于微軟技術,包括示例應用程序和詳細的說明文檔,以幫助開發人員迅速創建生產環境級計算機視覺、計算機聽覺、信號處理和統計應用軟件。

鏈接:http://accord-framework.net/

19. AForge.NET框架:AForge.NET專為計算機視覺和人工智能應用而設計,這種C#框架適用于圖像處理、神經網絡、遺傳算法、模糊邏輯、機器學習和機器人等。它包括幾個庫和示例應用程序。

鏈接:http://www.aforgenet.com/framework/

20. Aerosolve:這個“為人類設計的機器學習包”由Airbnb創建,旨在幫助為主機支持動態定價建議。它基于Java,特別適用于擁有地理位置相關變量的項目。

鏈接:http://airbnb.io/aerosolve/

21. 分布式機器學習工具包:這個微軟機器學習項目包括DMTK框架、Light LDA主題模型算法、分布式(多重)單詞嵌入算法以及LightGBM梯度提升樹框架。隨著研究深入開展,該公司計劃為該工具包添加更多的算法和組件。

鏈接:http://www.dmtk.io/

22. Dlib:Dlib提供了一套可快速執行的C ++機器學習庫。它包括諸多算法,可用于二進制分類、多類分類、回歸、結構預測、深度學習、聚類、非監督學習、半監督/度量學習、強化學習和特征選擇。

鏈接:http://dlib.net/ml.html

23. Encog:Encog自2008年以來就在積極開發中,它是由數據科學家杰夫·希頓(Jeff Heaton)創建的一種機器學習框架。它支持神經網絡、支持向量機、貝葉斯網絡、隱馬爾可夫模型、遺傳編程和遺傳算法。

鏈接:http://www.heatonresearch.com/encog/

24. GoLearn:GoLearn自詡為面向Go編程語言的“一應俱全的”機器學習庫。它力求簡單性和可定制性。

鏈接:https://github.com/sjwhitworth/golearn

25. Mahout:Mahout是Apache軟件基金會贊助的眾多機器學習項目之一,它提供了用于構建可擴展的機器學習應用程序的編程環境和框架。它還包括預制算法和名為Samsara的向量數學實驗環境。

鏈接:http://mahout.apache.org/

26. MLlib:作為Apache Spark項目的一部分,MLlib是一個機器學習庫,承諾性能比MapReduce高100倍。它包括眾多算法,用于分類、回歸、決策樹、推薦、聚類、主題建模、模式挖掘等。

鏈接:https://spark.apache.org/mllib/

27. Pattern:基于Python的Pattern提供了眾多工具,可用于數據挖掘、自然語言處理、機器學習、網絡分析和可視化。它尤其適用于Web挖掘這個應用場合。

鏈接:https://www.clips.uantwerpen.be/pages/pattern

28. Prophet:Prophet由Facebook開發和使用,可預測時間序列數據。它是用R或Python實現的,具有全自動、準確、快速和可調整優的特點。

鏈接:https://facebookincubator.github.io/prophet/

29. Oryx 2:Oryx 2由Cloudera開發,實現了用于機器學習的lambda架構。它基于Apache Spark和Kafka。

鏈接:http://oryx.io/

30. PredictionIO:PredictionIO現在是Apache孵化項目,這種機器學習服務器系統擁有可定制模板、實時查詢響應、從多個平臺獲取數據的功能等特性。它與其他開源工具整合起來,比如Spark、Mllib、HBase、Spray和Elasticsearch。

鏈接:http://predictionio.incubator.apache.org/index.html

31. SAMOA:SAMOA是Apache孵化項目,全稱是“可擴展高級大規模在線分析”。它是一種面向分布式流應用的機器學習框架。

鏈接:https://samoa.incubator.apache.org/

32. Scikit-learn:Scikit-learn基于NumPy、SciPy和matplotlib,提供了用于機器學習的Python工具。它使用分類、回歸、聚類以及降維等方面的算法來處理數據挖掘和數據分析。

鏈接:http://scikit-learn.org/stable/

33. Shark:Shark自稱是一種“快速、模塊化、功能豐富的開源C ++機器學習庫。”它提供了監督學習、非監督學習、進化算法、基本線性代數以及優化等方面的算法。

鏈接:http://image.diku.dk/shark/sphinx_pages/build/html/index.html

34. Shogun:Shogun自1999年以來就在開發中,它是一套成熟的機器學習工具,支持Python、Octave、R、Java/Scala、Lua、C#、Ruby及其他語言。它還有一項免費的云服務,用戶可以試用該軟件。

鏈接:http://www.shogun-toolbox.org/

35. Smile:Smile的全稱是“統計機器智能和學習引擎”,擁有極快的機器學習,支持Java、Scala及其他JVM語言。它聲稱“性能顯著優于R、Python、Spark、H2O和xgboost。”

鏈接:http://haifengl.github.io/smile/

相關推薦

熱門文章