OpenAI 使用超過 70,000 小時的遊戲畫面成功訓練出識玩 Minecraft 的AI bot,標誌著利用觀察和模仿的高級機器學習,有取得新的突破。
Minecraft AI 學會了執行複雜的行為,並使用鍵盤和滑鼠點擊序列來完成遊戲中的任務。包括:砍伐樹木和製作工具。它是第一個可以製作鑽石工具的 AI bot。而優秀的人類玩家完成同樣的任務,需要 20 分鐘和大約 24,000 次操作。
今次訓練的結果可以被視作模仿學習技術和神經網絡技術的新突破。模仿學習可用於訓練 AI 控制機械人手臂、駕駛汽車或瀏覽網頁;而神經網絡可訓練 AI 通過觀察人類執行任務來學習如何相同的執行任務。
網上有大量影片,顯示人們如何執行不同的任務。通過利用這些影像資源,OpenAI 研究人員希望能夠像 GPT-3 那樣,讓 AI bot 進行模仿學習。 Minecraft AI 研發團隊的成員 Bowen Baker 說:「在過去的幾年裡,我們看到 GPT-3 的興起,我們看到自在大量互聯網上訓練大型人工智能模型的驚人能力。」
GPT-3是由 OpenAI 訓練與開發,基於谷歌變換語言模型的人工智能。GPT-3 可聲稱文章,人類無法辨認相關文章是否 AI 自動生成。GPT-3原始論文的作者警告,GPT-3 可能對於社會產生負面影響,例如被人利用製造假新聞等。
資料來源:technologyreview