在視頻遊戲世界中建立互動代理

February 19, 2025

Dr. Ashish V

筆記

（1）Abramson，J.，Ahuja，A.，Barr，I.，Brussee，A.，Carnevale，F.，Cassin，M.，Chhaparia，R.，Clark，S.，Damoc，B.，Dudzik， Dudzik， A.和Georgiev，P.，2020。模仿互動智能。 ARXIV預印型ARXIV：2012.05672。

（2）Abramson，J.，Ahuja，A.，Brussee，A.，Carnevale，F.，Cassin，M.，Fischer，F.，Georgiev，P.，Goldin，A. F.，2021。創建具有模仿和自我監督學習的多模式互動代理。 ARXIV預印型ARXIV：2112.03763。

（3）Abramson，J.，Ahuja，A.，Carnevale，F.，Georgiev，P.，Goldin，A.，Hung，A.，Landon，J.，Lillicrap，T.，Muldal，A.，Richards， Richards， B.和Santoro，A.，2022。評估多模式互動劑。 ARXIV預印型ARXIV：2205.13274。

（4）Bai，Y.，Jones，A.，Ndousse，K.，Askell，A.，Chen，A.，Dassarma，N. T.和Joseph，N.，2022年。通過從人類反饋中學習的強化學習培訓了一位有益而無害的助手。 ARXIV預印型ARXIV：2204.05862。

（5）Christiano，PF，Leike，J.，Brown，T.，Martic，M.，Legg，S。和Amodei，D.，2017年。從人類的偏好中學習深度強化。 神經信息處理系統的進步，，，， 30。

Source link

在視頻遊戲世界中建立互動代理

Dr. Ashish V

筆記

You might also enjoy

CTGT VB ट्रांसफॉर्म 2025 पर सर्वश्रेष्ठ प्रस्तुति शैली का पुरस्कार जीतता है

Начало работы с Mlflow для оценки LLM

麻省理工學院和大眾楊百翰啟動聯合種子計劃，以加速健康創新|麻省理工學院新聞

Subscribe Our Newsletter

Deep See K.A.R.T. S.Pace