首頁(yè) > AI資訊 > 最新資訊 > 吳恩達(dá)deeplearning.ai的深度學(xué)習(xí)課程怎么樣?DT君為你劃重點(diǎn)

吳恩達(dá)deeplearning.ai的深度學(xué)習(xí)課程怎么樣?DT君為你劃重點(diǎn)

新火種    2023-10-25
想上手吳恩達(dá)深度學(xué)習(xí)最新課程的同學(xué)可以先看看這篇。許多人認(rèn)為機(jī)器學(xué)習(xí)太專業(yè)化,入門(mén)門(mén)檻高。但事實(shí)證明,機(jī)器學(xué)習(xí)是一個(gè)公共的、開(kāi)放的、活躍的領(lǐng)域,學(xué)習(xí)機(jī)器學(xué)習(xí)的不僅有來(lái)自計(jì)算機(jī)專業(yè)、人工智能專業(yè)、自動(dòng)化專業(yè)的專業(yè)人士,更有許多來(lái)自金融、物理、材料甚至藝術(shù)領(lǐng)域的其他人士,這些人一樣能夠精通機(jī)器學(xué)習(xí)——關(guān)鍵在于如何入門(mén)機(jī)器學(xué)習(xí),怎樣更快地掌握機(jī)器學(xué)習(xí)的本質(zhì)。吳恩達(dá)的機(jī)器學(xué)習(xí)課程在 Coursera 平臺(tái)上已上線 5 年左右,選課人數(shù)已達(dá)180多萬(wàn)人。該門(mén)課程是國(guó)內(nèi),乃至全球許多機(jī)器學(xué)習(xí)愛(ài)好者、專家學(xué)者的入門(mén)課程。整門(mén)課程深入淺出、簡(jiǎn)潔易懂。8月9日,吳恩達(dá)又宣布 deeplearning.ai 在 Coursera 平臺(tái)上開(kāi)設(shè)系列全新深度學(xué)習(xí)課程,包括神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)概述、神經(jīng)網(wǎng)絡(luò)參數(shù)調(diào)整及優(yōu)化、如何搭建機(jī)器學(xué)習(xí)項(xiàng)目、卷積神經(jīng)網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)序列模型。從課程設(shè)置上來(lái)看,涵蓋了深度學(xué)習(xí)的基礎(chǔ)理論和簡(jiǎn)單實(shí)操。這也是 deeplearning.ai 三大項(xiàng)目的第一個(gè)項(xiàng)目。據(jù)說(shuō)該課程火爆到 deeplearning.ai 的官網(wǎng)多次出無(wú)法訪問(wèn)。目前,課程中文版已于8月29日在網(wǎng)易公開(kāi)課上線。這門(mén)課如何?難易程度如何?是不是如吳所說(shuō)的那樣面向普通大眾?為了搞清楚這些問(wèn)題,DT君親測(cè)了這5門(mén)課中的3門(mén),并按難(kao)易(pu)程度給每門(mén)課打出分?jǐn)?shù),劃出重點(diǎn)。下面就跟著DT君來(lái)了預(yù)覽一下這個(gè)課程吧。第一門(mén)課評(píng)分:4.8分(滿分5分)結(jié)論:如果在該門(mén)課程中新增一個(gè)完全由自己設(shè)計(jì)解決的編程項(xiàng)目,那就完美了!一句話,“最本質(zhì)的東西往往是最簡(jiǎn)單的”。第一門(mén)課程是《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》。該門(mén)課程持續(xù)時(shí)間四周,視頻內(nèi)容包括了深度學(xué)習(xí)發(fā)展的必要性、神經(jīng)網(wǎng)絡(luò)基礎(chǔ)知識(shí)、淺層神經(jīng)網(wǎng)絡(luò)、深層神經(jīng)網(wǎng)絡(luò)以及對(duì)深度學(xué)習(xí)名人的采訪;編程作業(yè)則從Numpy庫(kù)中最常見(jiàn)的函數(shù)開(kāi)始、然后以神經(jīng)網(wǎng)絡(luò)的觀點(diǎn)看待邏輯回歸,接著又訓(xùn)練了僅含一個(gè)隱藏層的神經(jīng)網(wǎng)絡(luò),最后以深層神經(jīng)網(wǎng)絡(luò)的應(yīng)用結(jié)束。在學(xué)習(xí)整門(mén)課程的過(guò)程中,我最喜歡的是編程題的設(shè)計(jì)。我認(rèn)為這些設(shè)計(jì)非常有助于學(xué)習(xí)者對(duì)模型的理解,能抓住深度學(xué)習(xí)模型和算法的本質(zhì),降低了學(xué)習(xí)者完成該門(mén)課程的難度。這樣既能保證學(xué)習(xí)者學(xué)到知識(shí),也不會(huì)打擊學(xué)習(xí)者的信心。該門(mén)課程非常適合于機(jī)器學(xué)習(xí)入門(mén)者,即使是機(jī)器學(xué)習(xí)小白,只要能理解最基本的概率和矩陣運(yùn)算、能快速學(xué)會(huì)python編程,也能跟著編程指導(dǎo)順利地完成課程。第二門(mén)課評(píng)分: 4.9 分結(jié)論:該課程非常適合于已完成第一門(mén)課的學(xué)習(xí)者,也適合于對(duì)神經(jīng)網(wǎng)絡(luò)有一定基礎(chǔ)的學(xué)習(xí)者。希望在新一輪次的課程中,增加對(duì)Tensorflow 的指導(dǎo)。第二門(mén)課程是《改善神經(jīng)網(wǎng)絡(luò):調(diào)參、正則化和優(yōu)化》。該課程持續(xù)時(shí)間三周,視頻內(nèi)容主要包括如何避免模型的過(guò)擬合、選擇合適的優(yōu)化算法、選擇模型的超參數(shù)、介紹最流行的深度學(xué)習(xí)框架以及對(duì)深度學(xué)習(xí)名人的采訪。編程部分則包括了權(quán)重初始化、正則化方法、梯度檢查(檢驗(yàn)反向傳播算法是否正確運(yùn)行)、不同的優(yōu)化算法以及利用當(dāng)前最流行的深度學(xué)習(xí)框架Tensorflow實(shí)現(xiàn)多分類項(xiàng)目。該門(mén)課程延續(xù)了第一門(mén)課程的優(yōu)良傳統(tǒng),內(nèi)容豐富、難度不大、很實(shí)用、有助于提高學(xué)習(xí)者對(duì)深度學(xué)習(xí)的興趣(我最喜歡的仍然是其編程作業(yè),所有編程作業(yè)都給出了極其清晰的解答提示,你不需要寫(xiě)太多代碼就能使模型運(yùn)行,這大大地降低了完成、理解這門(mén)課的難度,會(huì)增強(qiáng)你進(jìn)行深度學(xué)習(xí)的信心?。?。第三門(mén)課評(píng)分: 4.7分第三門(mén)課程是《構(gòu)建機(jī)器學(xué)習(xí)項(xiàng)目》。該門(mén)課程持續(xù)兩周,是這個(gè)專項(xiàng)課程的一個(gè)特色,希望每個(gè)構(gòu)建機(jī)器學(xué)習(xí)項(xiàng)目的人都去汲取前輩的經(jīng)驗(yàn)教訓(xùn),以后少走彎路!這門(mén)課程不僅僅是針對(duì)機(jī)器學(xué)習(xí)、深度學(xué)習(xí)小白,也是針對(duì)所有在構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)中有困惑的各類人士。本文后半部分是DT君學(xué)完了吳恩達(dá)深度學(xué)習(xí)專項(xiàng)課程的第三門(mén)課程的一份簡(jiǎn)單的總結(jié),如果你對(duì)機(jī)器學(xué)習(xí)感興趣,立志從事機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的研究工作,希望這份總結(jié)對(duì)你有幫助。不完善之處,還望大家多多交流,共同進(jìn)步!要想成為一名優(yōu)秀的機(jī)器學(xué)習(xí)工程師,你不僅需要熟練地掌握機(jī)器學(xué)習(xí)的核心算法,更需要掌握機(jī)器學(xué)習(xí)的“基本”策略。那么,有哪些因素能保證我們的機(jī)器學(xué)習(xí)系統(tǒng)會(huì)更快、更有效地工作?第三課提供的經(jīng)驗(yàn)總結(jié)非常寶貴,是許多大學(xué)里深度學(xué)習(xí)課程里講不到的,這些經(jīng)驗(yàn)總結(jié)將為你構(gòu)建高性能的復(fù)雜機(jī)器學(xué)習(xí)系統(tǒng)指明方向,節(jié)約時(shí)間、成本。注:此圖是我在學(xué)完了這三門(mén)課程后用 Tensorflow 構(gòu)建的一個(gè)深層神經(jīng)網(wǎng)絡(luò),用于分類62種不同的交通標(biāo)志對(duì)象,600 次循環(huán)后準(zhǔn)確率在 92% 左右;在學(xué)習(xí)這課程之前,我曾嘗試構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)、包含三個(gè)隱藏層的深層神經(jīng)網(wǎng)絡(luò)解決這個(gè)問(wèn)題,但 600 次循環(huán)后準(zhǔn)確率不到 85% (這可能與我的神經(jīng)網(wǎng)絡(luò)權(quán)重初始化不同有關(guān))。試想一下,當(dāng)你構(gòu)建了一個(gè)準(zhǔn)確率已達(dá)90%的機(jī)器學(xué)習(xí)系統(tǒng),我們應(yīng)該怎樣進(jìn)一步改進(jìn)系統(tǒng)以取得實(shí)際應(yīng)用?可能你有很多想法:收集更多的訓(xùn)練數(shù)據(jù);保持訓(xùn)練數(shù)據(jù)集的多樣性;使用更大規(guī)模的神經(jīng)網(wǎng)絡(luò);使用不同的優(yōu)化算法;采用dropout層或使用L2正則化;更改神經(jīng)網(wǎng)絡(luò)的架構(gòu)等。面對(duì)如此多的選擇,我們究竟應(yīng)該如何抉擇?哪一種選擇是最有希望改善系統(tǒng)性能的?如果你的團(tuán)隊(duì)花費(fèi)了近半年的時(shí)間去收集數(shù)據(jù),結(jié)果發(fā)現(xiàn)更多的數(shù)據(jù)并不是該系統(tǒng)性能提升的決定性因素,這樣你們就浪費(fèi)了大量如同你生命一樣寶貴的時(shí)間。策略一:正交化過(guò)程構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)的最大挑戰(zhàn)包括調(diào)參,調(diào)參的過(guò)程中你有許多種選擇,如果時(shí)間允許的話,你可以各種嘗試。但是經(jīng)驗(yàn)表明,最高效的機(jī)器學(xué)習(xí)人員他們很清楚什么樣的方式最有效,這就要用到正交化的思想。舉個(gè)例子,一臺(tái)老式的電視機(jī),上面有很多旋鈕,你可以采用各種方式調(diào)整照片。但是,最有效的調(diào)整方式就是,每個(gè)旋鈕只擁有一個(gè)功能,然后再調(diào)整旋鈕。電子工程師已經(jīng)花費(fèi)了大量的時(shí)間來(lái)保證每個(gè)設(shè)計(jì)的旋鈕都有相對(duì)可解釋的功能:一個(gè)旋鈕控制圖像的高度,一個(gè)旋鈕控制圖像的寬度,一個(gè)旋鈕控制視頻的左右位置,其它的分別控制圖像的旋轉(zhuǎn)、平移——這樣的設(shè)置確保了人能更加容易地操縱圖像;如果一個(gè)旋鈕控制著所有的功能,你幾乎不可能調(diào)整電視圖像。這就是正交化的設(shè)計(jì)思維,它能確保我們的操作簡(jiǎn)單、具有可解釋性。那么,這與機(jī)器學(xué)習(xí)有什么關(guān)系呢?在構(gòu)建有監(jiān)督機(jī)器學(xué)習(xí)的系統(tǒng)中,我們也在做類似的過(guò)程。首先,我們必須確保我們的系統(tǒng)能在訓(xùn)練集上表現(xiàn)很好,然后在交叉驗(yàn)證集上,最后是測(cè)試集。如果你的算法在訓(xùn)練集上表示不好,這時(shí)你需要一個(gè)專用的“旋鈕”來(lái)解決這個(gè)問(wèn)題,這可能是你需要訓(xùn)練更大的神經(jīng)網(wǎng)絡(luò),也或許是要采用更好的優(yōu)化算法,如 Adam 優(yōu)化算法;如果你的系統(tǒng)在交叉驗(yàn)證集上表示不好,那么你也需要開(kāi)發(fā)出另一組正交化的“旋鈕”來(lái)解決這個(gè)問(wèn)題,這可能需要你采用更大的訓(xùn)練集,這有助于你的機(jī)器學(xué)習(xí)算法更好地泛化到交叉驗(yàn)證集上;如果你的系統(tǒng)在交叉驗(yàn)證集上也表現(xiàn)很好,但測(cè)試集上性能較差又怎么辦呢?在這種情況下,你應(yīng)該調(diào)整旋鈕得到一個(gè)更大的交叉驗(yàn)證集;如果你的系統(tǒng)在測(cè)試集上也表現(xiàn)不錯(cuò),但是用戶體驗(yàn)較差,這意味著你可能需要回去重新選擇交叉驗(yàn)證集或成本函數(shù)。在構(gòu)建高性能的機(jī)器學(xué)習(xí)系統(tǒng)時(shí),我們應(yīng)該清楚哪個(gè)模塊出現(xiàn)了問(wèn)題,針對(duì)這些不同的模塊采取不同的措施,機(jī)器學(xué)習(xí)系統(tǒng)的構(gòu)建應(yīng)充分考慮正交化的概念,確保各個(gè)流程、各個(gè)功能不交叉,保持相對(duì)的獨(dú)立性,具有可解釋的功能性。策略二:確定單一的模型性能評(píng)價(jià)指標(biāo)和選擇合適的訓(xùn)練集、交叉驗(yàn)證集/測(cè)試集無(wú)論你是調(diào)整超參數(shù),還是嘗試不同的學(xué)習(xí)算法,甚至是使用不同的機(jī)器學(xué)習(xí)模型,你都需要確定一個(gè)模型性能的評(píng)價(jià)指標(biāo)。有了性能評(píng)價(jià)指標(biāo),你能快速地判斷出新的嘗試是否有效,這會(huì)加速你構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)的步伐。應(yīng)用機(jī)器學(xué)習(xí)需要豐富的經(jīng)驗(yàn),一個(gè)比較好的做法是,先編寫(xiě)代碼,然后運(yùn)行代碼查看實(shí)驗(yàn)結(jié)果,并據(jù)此來(lái)繼續(xù)改進(jìn)你的算法。比如,你先建立了一個(gè)簡(jiǎn)單的分類器A,然后通過(guò)調(diào)整模型中的某些超參數(shù)或一些其它東西,你可以訓(xùn)練出一個(gè)新的分類器B,然后根據(jù)性能評(píng)估指標(biāo)評(píng)估你分類器的優(yōu)劣。采用精確率和召回率評(píng)估分類器的性能可能是合理的,但是可能會(huì)出現(xiàn)這樣的問(wèn)題:分類器A上的精確率更高,這意味著分類器A的預(yù)測(cè)結(jié)果準(zhǔn)確率更高;分類器B的召回率更高,意味著分類器B的誤分類概率更低。那么分類器A和分類器B誰(shuí)更優(yōu)呢?另外,如果你嘗試許多想法,采用不同的參數(shù),這通常會(huì)得到更多的分類器,如何從這些分類器中選擇最好的分類器呢?這時(shí)如果仍然使用兩個(gè)指標(biāo)衡量模型性能,就顯得不太合理,所以最好的方式是綜合考慮精確率和召回率,如F1分?jǐn)?shù)就是這樣的一個(gè)指標(biāo)。采用這樣的評(píng)估指標(biāo),會(huì)加速機(jī)器學(xué)習(xí)的迭代過(guò)程。有時(shí),我們并不能只是關(guān)注精確率、召回率,甚至是F1分?jǐn)?shù),我們需要考慮訓(xùn)練機(jī)器學(xué)習(xí)系統(tǒng)的更多限制因素,如時(shí)間、金錢(qián)。這時(shí),單一的性能評(píng)估指標(biāo)并不能滿足我們的要求。更一般地說(shuō),我們需要在多個(gè)目標(biāo)中確定出一個(gè)最合理的優(yōu)化目標(biāo),將其它目標(biāo)或條件作為限制性因素,然后在訓(xùn)練集或交叉驗(yàn)證集上或測(cè)試集上進(jìn)行評(píng)估或計(jì)算,選出在有限制的條件下的最優(yōu)算法。訓(xùn)練集、交叉驗(yàn)證集和測(cè)試集的選擇對(duì)構(gòu)建機(jī)器學(xué)習(xí)應(yīng)用產(chǎn)品具有巨大的影響。那么,我們應(yīng)該怎樣選取這些數(shù)據(jù)集來(lái)提高團(tuán)隊(duì)開(kāi)發(fā)機(jī)器學(xué)習(xí)系統(tǒng)的效率?訓(xùn)練機(jī)器學(xué)習(xí)模型時(shí),通常會(huì)嘗試許多不同的想法,在訓(xùn)練集上訓(xùn)練不同的模型,然后使用交叉驗(yàn)證集驗(yàn)證你的想法并選擇一個(gè)模型。繼續(xù)保持訓(xùn)練,在驗(yàn)證集上提高你的模型,最后在測(cè)試集上評(píng)估模型。事實(shí)證明,交叉驗(yàn)證集和測(cè)試集應(yīng)該來(lái)自于同一數(shù)據(jù)分布。確定好單一的性能評(píng)估指標(biāo)和交叉驗(yàn)證集后,機(jī)器學(xué)習(xí)團(tuán)隊(duì)就可以快速地進(jìn)行創(chuàng)新,嘗試不同的想法,運(yùn)行實(shí)驗(yàn),選擇最好的模型。所以建議是,在劃分?jǐn)?shù)據(jù)集前,先將數(shù)據(jù)均勻混洗,再劃分交叉驗(yàn)證集和測(cè)試集,這樣就能保證兩個(gè)數(shù)據(jù)集來(lái)自相同的分布。事實(shí)證明,驗(yàn)證集和測(cè)試集的規(guī)模選擇也正在改變機(jī)器學(xué)習(xí)領(lǐng)域。你可能聽(tīng)說(shuō)過(guò)機(jī)器學(xué)習(xí)領(lǐng)域內(nèi)70/30的經(jīng)驗(yàn)法則之一,即將所有的數(shù)據(jù)按70:30的比例劃分為訓(xùn)練集和測(cè)試集,或者將數(shù)據(jù)集的60%劃為訓(xùn)練集,20%劃為交叉驗(yàn)證集,20%劃為測(cè)試集。這在早期的機(jī)器學(xué)習(xí)領(lǐng)域相當(dāng)合理,尤其是當(dāng)數(shù)據(jù)量很少的時(shí)候。但是,現(xiàn)代的機(jī)器學(xué)習(xí)領(lǐng)域,數(shù)據(jù)集的規(guī)模極其龐大,這種情況下 70/30 的經(jīng)驗(yàn)規(guī)則不再適用。假如你有 100 萬(wàn)個(gè)樣例,可以選取其中的 98% 作為訓(xùn)練集, 1%作為交叉驗(yàn)證集,剩余 1%作為測(cè)試集才合理。這是因?yàn)槠渲械?1% 也有 10000 個(gè)樣例,對(duì)于測(cè)試集和交叉驗(yàn)證集已經(jīng)足夠了。所以在現(xiàn)代大規(guī)模數(shù)據(jù)集的機(jī)器學(xué)習(xí)或深度學(xué)習(xí)過(guò)程中,測(cè)試集和交叉驗(yàn)證集的劃分比例遠(yuǎn)遠(yuǎn)小于 20%。另外,深度學(xué)習(xí)算法對(duì)數(shù)據(jù)的需求量極大,所以大部分的數(shù)據(jù)都可以劃分入訓(xùn)練集。而使用測(cè)試集的目的就是驗(yàn)證最終機(jī)器學(xué)習(xí)系統(tǒng)的可靠性,增加你對(duì)機(jī)器學(xué)習(xí)系統(tǒng)整體性能的信心。除非你需要非常準(zhǔn)確地衡量系統(tǒng)的最終表現(xiàn),否則你的測(cè)試集不需要數(shù)以百萬(wàn)計(jì)的樣例,成千上萬(wàn)的數(shù)據(jù)足矣。策略三:調(diào)整性能評(píng)估指標(biāo)和交叉驗(yàn)證集/測(cè)試集選擇交叉驗(yàn)證集和評(píng)估指標(biāo)就如同打靶。很多時(shí)候,你的項(xiàng)目已經(jīng)進(jìn)行了一部分,你才發(fā)現(xiàn)你將目標(biāo)選錯(cuò)了,這如同你在打靶過(guò)程看錯(cuò)了靶子的位置。因此,建立機(jī)器學(xué)習(xí)系統(tǒng)時(shí),第一步應(yīng)該是確定評(píng)估指標(biāo),哪怕確定的評(píng)估指標(biāo)并不一定最好,但你要有這個(gè)意識(shí);然后采用正交化過(guò)程中的各個(gè)步驟,使算法能很好地工作。例如,你建立了兩個(gè)識(shí)別貓的分類器A和B,它們?cè)诮徊骝?yàn)證集上的分類錯(cuò)誤率分別是3%,5%,但當(dāng)你在實(shí)際中測(cè)試你的算法的時(shí)候,你發(fā)現(xiàn)分類器B卻做的更好——這可能是你選擇的交叉驗(yàn)證集是高質(zhì)量的貓圖片,而建立的機(jī)器學(xué)習(xí)應(yīng)用程序要處理的卻是大量低質(zhì)量的貓圖像,這些圖片不僅模糊,也可能包含各種奇怪的貓表情。這種情況下,你就需要改變你的交叉驗(yàn)證集以使你的數(shù)據(jù)能更好地反映出你實(shí)際情況。總而言之,如果目前的評(píng)估指標(biāo)和數(shù)據(jù)不能很好地應(yīng)對(duì)你真正關(guān)心的事情,這就是改變你的評(píng)估指標(biāo)和/或交叉驗(yàn)證集/測(cè)試集的好時(shí)機(jī)。這會(huì)使你的算法更好地捕獲你所關(guān)心的信息;這對(duì)于確定算法的優(yōu)劣,加速想法的迭代過(guò)程,提高算法效率很有幫助。策略四:將系統(tǒng)的表現(xiàn)與人類的表現(xiàn)相比,確定提升系統(tǒng)性能的方法我們經(jīng)常發(fā)現(xiàn),當(dāng)機(jī)器學(xué)習(xí)系統(tǒng)在某些方面超越人之前,系統(tǒng)的性能提升最快,在超越人之后,進(jìn)步就變得緩慢。人類非常擅長(zhǎng)分類,識(shí)別事物,聽(tīng)音樂(lè),做閱讀理解。當(dāng)系統(tǒng)的性能超越人之前,人類總能使用特定的策略幫助改善系統(tǒng)的性能。這些策略包括使用更多標(biāo)簽化的數(shù)據(jù);從誤差分析中獲得啟示;進(jìn)行偏差和方差分析。當(dāng)系統(tǒng)的表現(xiàn)超越人之后,這些策略將更難奏效。這就是為什么要將機(jī)器學(xué)習(xí)系統(tǒng)的表現(xiàn)行為與人類的表現(xiàn)行為相比,尤其是在人類擅長(zhǎng)的任務(wù)上。一個(gè)監(jiān)督的機(jī)器學(xué)習(xí)系統(tǒng)要正常工作,從根本上來(lái)說(shuō),要保證兩個(gè)方面:第一,很好地?cái)M合訓(xùn)練集,低偏差;第二,訓(xùn)練的系統(tǒng)要有很強(qiáng)的泛化能力,即要在交叉驗(yàn)證集或測(cè)試集上很好地工作,低方差。在提升機(jī)器學(xué)習(xí)系統(tǒng)性能之前,首先要明白機(jī)器學(xué)習(xí)系統(tǒng)的訓(xùn)練誤差與人類誤差之間的差異,辨別是否存在高偏差。解決高偏差可以使用以下幾種方法:使用更大的神經(jīng)網(wǎng)絡(luò)模型;訓(xùn)練更長(zhǎng)的時(shí)間;使用 ADAM,Momentum,NAG,Adagrad, Adadelta,RMSProp 等更好的算法;調(diào)整神經(jīng)網(wǎng)絡(luò)架構(gòu),這包括神經(jīng)網(wǎng)絡(luò)的層數(shù)、神經(jīng)元的連接方式、神經(jīng)元個(gè)數(shù),激活函數(shù)等超參數(shù)。然后,比較交叉驗(yàn)證集或測(cè)試集與訓(xùn)練集上的誤差,確定是否具有高方差。方差的高低意味著你的模型是否具有很好的泛化能力。遇到高方差,可以采用以下幾種方式解決:收集更多的數(shù)據(jù)訓(xùn)練模型;使用正則化方法,這包括采用dropout,數(shù)據(jù)增強(qiáng),權(quán)重正則化等;調(diào)整神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)等。評(píng)分希望 DT 君的親測(cè)總結(jié)能幫助解決大家在構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)中的某些疑惑,節(jié)約時(shí)間、成本,加快構(gòu)建機(jī)器學(xué)習(xí)系統(tǒng)的步伐。
相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢(qián)損失負(fù)任何責(zé)任。

熱門(mén)文章