首頁(yè) > AI資訊 > 最新資訊 > 機(jī)器學(xué)習(xí)的原理是什么?

機(jī)器學(xué)習(xí)的原理是什么?

新火種    2023-10-19

訓(xùn)過(guò)小狗沒(méi)?

沒(méi)訓(xùn)過(guò)的話總見(jiàn)過(guò)吧?

你要能理解怎么訓(xùn)狗,就能非常輕易的理解機(jī)器學(xué)習(xí)的原理.

比如你想教小狗學(xué)習(xí)動(dòng)作“坐下”一開(kāi)始小狗根本不知道你在說(shuō)什么。但是如果你每次都說(shuō)坐下”然后幫助它坐下,并給它一塊小零食作為獎(jiǎng)勵(lì),經(jīng)過(guò)多次重復(fù),狗就會(huì)學(xué)會(huì)當(dāng)聽(tīng)到“坐下”這個(gè)詞時(shí)就要坐下。

以此類推,小狗可以聽(tīng)懂各種指令,比如坐下,蹲下,握手等等

機(jī)器學(xué)習(xí)本質(zhì)上跟教小狗一模一樣,只不過(guò)機(jī)器學(xué)習(xí)不是一條狗或者一只貓,而是用的“模型“

我們用電腦和特殊的程序(叫做“模型”)來(lái)代替小狗。我們給電腦一堆數(shù)據(jù),比如一堆照片,其中有些是貓,有些是狗。然后我們告訴電腦哪些是貓,哪些是狗(這叫“標(biāo)簽”)。電腦就像小狗一樣,通過(guò)這些“示范”和“獎(jiǎng)勵(lì)”(或“懲罰”)來(lái)學(xué)習(xí)怎么區(qū)分貓和狗Q

比如“模型”每區(qū)分正確一張照片,就給它獎(jiǎng)勵(lì)一分,否則扣一分,然后我們?cè)O(shè)定了目標(biāo)是分?jǐn)?shù)越高越好,那么“模型”就會(huì)根據(jù)這個(gè)機(jī)制進(jìn)行不斷的學(xué)習(xí),最后就成為了一個(gè)非常優(yōu)秀的區(qū)分貓狗的“好模型”

但與教小狗不同,電腦可以快速地查看成千上萬(wàn)張照片,并從中學(xué)習(xí)。電腦也可以學(xué)習(xí)很多其他復(fù)雜的任務(wù),比如識(shí)別人的聲音、推薦你可能喜歡的音樂(lè),甚至幫助醫(yī)生診斷疾病。

從上面我們可以總結(jié)出來(lái)幾個(gè)名詞:

模型(Model):模型就像是電腦的“大腦”的決策用來(lái)處理和學(xué)習(xí)數(shù)據(jù)。你可以想象它為一個(gè)迷工廠,輸入數(shù)據(jù)進(jìn)去,輸出結(jié)果。數(shù)據(jù)集(Dataset):數(shù)據(jù)集就是用來(lái)訓(xùn)練模型的大量信息。這些信息可能是文字、圖像、聲音等。標(biāo)簽(Label):標(biāo)簽是對(duì)數(shù)據(jù)集中每一項(xiàng)數(shù)據(jù)的解釋或標(biāo)記。比如,在一個(gè)由貓和狗照片組成的數(shù)據(jù)集中,每張照片會(huì)被標(biāo)簽為“貓”或“狗”。訓(xùn)練(Train)和測(cè)試(Test):訓(xùn)練是讓模型從標(biāo)簽好的數(shù)據(jù)集中學(xué)習(xí)的過(guò)程。測(cè)試則是檢查模型是否真的學(xué)會(huì)了某件事。獎(jiǎng)勵(lì)(Reward)和懲罰(Punishment):在某些機(jī)器學(xué)習(xí)模式中,模型會(huì)根據(jù)其預(yù)測(cè)的準(zhǔn)確性獲得獎(jiǎng)勵(lì)或懲罰。監(jiān)督學(xué)習(xí) (Supervised Learning) 和無(wú)監(jiān)督學(xué)習(xí) (Unsupervised Learning):在監(jiān)督學(xué)習(xí)中模型從帶有標(biāo)簽的數(shù)據(jù)中學(xué)習(xí)。在無(wú)監(jiān)督學(xué)習(xí)中,數(shù)據(jù)沒(méi)有標(biāo)簽,模型需要自己找出數(shù)據(jù)的結(jié)。

從上面來(lái)看其實(shí)我們歸納一下,機(jī)器學(xué)習(xí)就是讓電腦通過(guò)數(shù)據(jù)和例子來(lái)學(xué)習(xí)做某件事,而不是由人直接編程告訴它每一步應(yīng)該怎么做。

這一句話會(huì)有點(diǎn)兒難懂,那么還是拿訓(xùn)練計(jì)算機(jī)去分辨貓狗照片來(lái)舉例。

我們想要做的是讓計(jì)算機(jī)去自動(dòng)的學(xué)會(huì)分辨貓和狗,而不是告訴計(jì)算機(jī)這是一張哈士奇的圖,另張是金毛。

這跟自動(dòng)的分辨有什么區(qū)別呢?

區(qū)別就在于“學(xué)習(xí)”,因?yàn)樨埡凸凡幌袷前⒗當(dāng)?shù)字,只有從0到9的10個(gè)數(shù)字,你直接硬塞給計(jì)算機(jī)這10個(gè)數(shù)字是沒(méi)問(wèn)題的。

但是貓和狗不一樣,世界上有很多種的貓和狗,純種的,雜交的,國(guó)內(nèi)的,國(guó)外的,還有不同角度拍的,俯拍的,正面拍的,背后拍的,照片不是很清楚的。

你沒(méi)有辦法告訴計(jì)算機(jī)所有的關(guān)于貓和狗的照片,另外給所有的照片打上標(biāo)簽也是不現(xiàn)實(shí)的,因?yàn)楣ぷ髁刻螅绻覀儸F(xiàn)在要把大象,老虎,獅子,馬等等動(dòng)物都進(jìn)行分類呢?

每種動(dòng)物都要打標(biāo)簽的話那工作量簡(jiǎn)直是天文數(shù)字

事實(shí)上,你想想自己分辨這些動(dòng)物的過(guò)程,需要看很多的照片嗎?

比如老虎和獅子Q,你基本上看個(gè)2,3張照片就可以輕松的進(jìn)行分辨

根本不需要成千上萬(wàn)張,甚至一張不太清楚的照片也不會(huì)影響你去做分辨

而我們想要計(jì)算機(jī)實(shí)現(xiàn)的功能就是學(xué)習(xí)能力,我們提供給計(jì)算機(jī)每種動(dòng)物幾百?gòu)堈掌缓蟾嬖V它每張照片對(duì)應(yīng)的動(dòng)物

我們希望它可以通過(guò)學(xué)習(xí)這些圖片來(lái)獲得識(shí)別動(dòng)物的能力。

比如根據(jù)他們的毛色,提醒大小,形體特征等等。

對(duì)于機(jī)器學(xué)習(xí)以及人工智能的學(xué)習(xí),與ChatGPT結(jié)合,這是對(duì)于新手來(lái)說(shuō)避免被落下太多,甚至被取代的好方法。它比多數(shù)書籍更強(qiáng)大,像個(gè)知無(wú)不言的老師,它可以放大你的能力,比如說(shuō)你不擅長(zhǎng)代碼,那么它可以幫助你實(shí)現(xiàn)你的想法,無(wú)論什么語(yǔ)言它都可以做的非常棒。其實(shí)無(wú)論是從業(yè)者,還是對(duì)這一行感興趣的朋友,都特別推薦去看看[知乎知學(xué)堂%的2天公開(kāi)課,快速掌握大模型的潛力和應(yīng)用。

這就是[機(jī)器學(xué)習(xí)]Machine Learning這個(gè)名詞的來(lái)源,主要原理可以概括為“從經(jīng)驗(yàn)中學(xué)習(xí)”

明確目標(biāo):首先,你需要明確你想讓模型(或小狗)完成的任務(wù)。例如,區(qū)分貓和狗。

收集數(shù)據(jù):接著,你需要準(zhǔn)備一個(gè)數(shù)據(jù)集。就像你會(huì)有很多“坐下”的場(chǎng)景來(lái)教狗一樣

標(biāo)簽與示范: 在監(jiān)督學(xué)習(xí)中,你需要標(biāo)簽來(lái)告訴模型數(shù)據(jù)集中每項(xiàng)數(shù)據(jù)的意義。這像是每次幫助小狗坐下并說(shuō)“這是坐下”

訓(xùn)練與調(diào)整:使用數(shù)據(jù)和標(biāo)簽來(lái)訓(xùn)練模型,模型會(huì)嘗試找出數(shù)據(jù)之間的規(guī)律或關(guān)系。如果模型做得好,它會(huì)獲得“獎(jiǎng)勵(lì)”;做得不好,則會(huì)受到“懲罰”

測(cè)試與評(píng)估:一旦模型經(jīng)過(guò)足夠的訓(xùn)練,你就可以用沒(méi)有標(biāo)簽的新數(shù)據(jù)來(lái)測(cè)試它,看看其表現(xiàn)如何.

應(yīng)用與拓展:一旦模型經(jīng)過(guò)測(cè)試并證明有效,它就可以用于各種其他任務(wù),從識(shí)別聲音到醫(yī)療診斷

總的來(lái)說(shuō),機(jī)器學(xué)習(xí)是一種通過(guò)數(shù)據(jù)和算法來(lái)訓(xùn)練模型,使其能夠完成特定任務(wù)或做出預(yù)測(cè)的技術(shù)。與訓(xùn)練小狗不同,模型可以處理非常大量的數(shù)據(jù),并用于解決各種復(fù)雜的問(wèn)題。

區(qū)分下幾個(gè)經(jīng)常會(huì)被混淆的名詞: 機(jī)器學(xué)習(xí)/人工智能/深度學(xué)習(xí)

從下圖可以看到

人工智能AI是一個(gè)廣泛的概念,包括所有模仿、延伸或者擴(kuò)充人類智能的技術(shù)

機(jī)器學(xué)習(xí)是AI中的一個(gè)分支,主要

深度學(xué)習(xí)則是機(jī)器學(xué)習(xí)中的一個(gè)子集,專注于使用類似人腦的神經(jīng)網(wǎng)絡(luò)進(jìn)行高級(jí)、復(fù)雜的任務(wù)

相關(guān)推薦
免責(zé)聲明
本文所包含的觀點(diǎn)僅代表作者個(gè)人看法,不代表新火種的觀點(diǎn)。在新火種上獲取的所有信息均不應(yīng)被視為投資建議。新火種對(duì)本文可能提及或鏈接的任何項(xiàng)目不表示認(rèn)可。 交易和投資涉及高風(fēng)險(xiǎn),讀者在采取與本文內(nèi)容相關(guān)的任何行動(dòng)之前,請(qǐng)務(wù)必進(jìn)行充分的盡職調(diào)查。最終的決策應(yīng)該基于您自己的獨(dú)立判斷。新火種不對(duì)因依賴本文觀點(diǎn)而產(chǎn)生的任何金錢損失負(fù)任何責(zé)任。

熱門文章