首頁 > AI資訊 > 最新資訊 > GitHub標星6000+!Python帶你實踐機器學習圣經PRML

GitHub標星6000+!Python帶你實踐機器學習圣經PRML

新火種    2023-11-13
【新智元導讀】PRML是模式識別和機器學習領域的經典著作,出版于2007年。該書作者 Christpher M. Bishop 是模式識別和機器學習領域的專家,其1995年所著的“Nerual Networks for Pattern Recognition”也是模式識別、人工神經網絡領域的經典著作。將 Bishop 大神的 PRML 稱為機器學習圣經一點也不為過,該書系統地介紹了模式識別和機器學習領域內詳細的概念與基礎。書中有對概率論基礎知識的介紹,也有高階的線性代數和多元微積分的內容,適合高校的研究生以及人工智能相關的從業(yè)人員學習。知乎上關于這個關于“PRML為何是機器學習的經典書籍中的經典?”的高贊回答或許會給大家一些啟發(fā):Luau Lawrence的回答: 對初學者確實有一定難度,如果覺得吃力可以先讀一下知乎上推薦的科普性讀物,掌握了機器學習的基礎概念之后再進行后續(xù)的學習。首先我們來看一下 PRML 的主要內容:第一章是引子,用曲線擬合讓讀者對機器學習有個大概理解。第二章主要是介紹了一下基礎的統計方面的知識,包括期望方差的計算、高斯分布的參數估計與理解、高斯分布的性質等。第三章和第四章主要在講最基礎的線性模型,并且展示了如何將其應用在分類和回歸的場景下,貝葉斯方法是整本書的核心。第五章介紹了神經網絡,在線性模型的基礎上引入了多層感知機模型,即常說的 BP 網絡。第六章講的是核方法,核是兩個樣本的內積,也可以理解為某個希爾伯特空間中由內積定義的“距離”。主要講了線性模型轉成核表達的方式、核的構建以及高斯過程。第七章是向量機,向量機講的是貝葉斯模型如何通過先驗找到一個稀疏的模型。第八章是講的圖模型,對變量的獨立性、隱變量和參數的區(qū)別(這個會在變分貝葉斯中體現)做了很好的闡釋。第九章講了混合模型和 EM 算法,涉及了隱變量的概念和 EM 算法等。第十章講的是變分推斷,解決了基于現在的模型的分布假設,推斷參數難的問題。第十一章講采樣方法,介紹了不同采樣方法的優(yōu)缺點,并重點講了MCMC采樣。第十二章講主成分分析,是考察多個變量間相關性一種多元統計方法,研究如何通過少數幾個主成分來揭示多個變量間的內部結構。第十三章講的是序列數據,序列數據的特點及馬爾可夫假設等。第十四章講的是Ensemble,包括適應性的 boosting 最著名的 AdaBoost,以及一些其他的融合方法。看這些理論知識是非常枯燥的,很多初學者感覺學起來非常吃力,甚至半途放棄,如果你也有這些困擾,那么下面提到的這個 GitHub 項目也許可以幫你走出困境。在 notebooks 文件夾下實現了聚類方法、特征抽取、線性模型、核方法、馬爾科夫模型、概率分布模型、采樣方法和神經網絡方法等內容,你可以將目錄切換到notebooks 下直接打開對應的 ipynb 文件進行練習。該 GitHub 項目所需要的編程語言為 Python 3,其它科學計算庫還需要 NumPy 、SciPy、 Matplotlib、Scikit-learn等,如果你是 Python 初學者,那么我們強力推薦你安裝 Annaconda,它集成了所有需要的計算庫,并且可以在 jupyter notebook 交互式的查看執(zhí)行的結果。這么好的資源趕緊學起來吧!
相關推薦
免責聲明
本文所包含的觀點僅代表作者個人看法,不代表新火種的觀點。在新火種上獲取的所有信息均不應被視為投資建議。新火種對本文可能提及或鏈接的任何項目不表示認可。 交易和投資涉及高風險,讀者在采取與本文內容相關的任何行動之前,請務必進行充分的盡職調查。最終的決策應該基于您自己的獨立判斷。新火種不對因依賴本文觀點而產生的任何金錢損失負任何責任。

熱門文章