率先解決多類數據同時受損,中科大MIRA團隊TRACER入選NeurIPS2024:強魯棒性的離線變分貝葉斯強化學習
本論文作者楊睿是中國科學技術大學 2019 級碩博連讀生,師從王杰教授、李斌教授,主要研究方向為強化學習、自動駕駛等。他曾以第一作者在 NeurIPS、KDD 等頂級期刊與會議上發表論文兩篇,曾獲滴滴精英實習生(16/1000+)。近日,中科大王杰教授團隊 (MIRA Lab) 針對離線強化學習數據
本論文作者楊睿是中國科學技術大學 2019 級碩博連讀生,師從王杰教授、李斌教授,主要研究方向為強化學習、自動駕駛等。他曾以第一作者在 NeurIPS、KDD 等頂級期刊與會議上發表論文兩篇,曾獲滴滴精英實習生(16/1000+)。近日,中科大王杰教授團隊 (MIRA Lab) 針對離線強化學習數據