深度強(qiáng)化學(xué)習(xí)探索算法最新綜述,近200篇文獻(xiàn)揭示挑戰(zhàn)和未來方向
作者:楊天培、湯宏垚、白辰甲、劉金毅等強(qiáng)化學(xué)習(xí)是在與環(huán)境交互過程中不斷學(xué)習(xí)的,交互中獲得的數(shù)據(jù)質(zhì)量很程度上決定了智能體能夠?qū)W習(xí)到的策略的平。因此,如何引導(dǎo)智能體探索成為強(qiáng)化學(xué)習(xí)領(lǐng)域研究的核問題之。本介紹天津?qū)W深度強(qiáng)化學(xué)習(xí)實(shí)驗(yàn)室近期推出的深度強(qiáng)化學(xué)習(xí)領(lǐng)域第篇系統(tǒng)性的綜述章,該綜述次全梳理了DRL和MA