對于大多數新的Minecraft玩家來說,花幾分鍾的時間才能弄清楚如何挖掘出遊戲中至關重要的鑽石,但是事實證明,培訓人工智能技術來完成這項工作比預期的要困難。
19年整個夏天,Minecraft的發行商其他組織都向程序員發起鑽石挑戰,要求他們編寫可以找到令人垂涎的鑽石的AI程序。
大多數新手可以在第一次遊戲中就可以挖到鑽石。
但是在提交的660多個程序代碼中,沒有一個可以完成任務。
目前的目標是是否可以在不需要大量計算能力的情況下解決該問題。
一位組織者表示,她對某個程序員的代碼“印象深刻”。參賽者可以使用記錄的人類遊戲庫,展示如何導航遊戲,獲取遊戲中的物品並避免“死亡”。
微軟研究院首席研究員卡特娅·霍夫曼说:“我们提出的任务非常艰巨。” “在Minecraft中查找鑽石需要許多步驟-從砍伐樹木到制作工具,再到探索洞穴並實際找到鑽石。
“雖然沒有提交的代碼完全解決任務,但他們已經取得了很大的進步,並學會了制作此過程中所需的許多工具。”
開采鑽石
自2011年發布以來,《我的世界》就已經大受歡迎。
這款開放世界遊戲的銷量已超過1.8億冊,每月活躍玩家超過1.12億。
鑽石是Minecraft中最重要的資源之一,因爲它可以用來制造強大的裝甲和強大的武器。
然而,爲了獲得鑽石,玩家必須首先完成許多其他步驟。
Minecraft玩家朱爾斯·波特利(Jules Portelly)告訴英國廣播公司,“如果您熟悉這款遊戲,則不需要花費超過20分鍾即可獲得第一枚鑽石。”
參賽者只能使用一個圖形處理單元(GPU)和四天的培訓時間。就上下文而言,人工智能系統通常需要數月或數年的遊戲時間才能掌握《星際爭霸2》之類的遊戲。
參賽者還可以使用一個相對較小的Minecraft數據集,其中記錄了6000萬幀人類玩家數據,以讓他們的系統進行學習。參與者必須提交其源代碼,以便組織者可以對其進行驗證
霍夫曼博士解釋說:“每集開始時,它們都是在程序生成的Minecraft世界中産生的。”
“因此,他們確實需要學習尋找資源,制造工具和尋找鑽石的概念。”
- Minecraft進行人工智能實驗
- DeepMind AI在《星際爭霸2》中獲得大師級地位
- AI助手將協助Minecraft玩家
組織者希望程序員通過稱爲“模仿學習”的技術來創建通過示例學習的程序。
這涉及通過讓AI代理模仿人類或其他軟件解決任務的方式來嘗試使AI代理采用最佳方法。
這與單純依靠“強化學習”形成了鮮明對比。在“強化學習”中,一個智能體被有效地訓練,通過反複試驗找到最佳解決方案,而不需要利用過去的知識。
全民人工智能
研究人員發現,單獨使用強化學習有時可以獲得更好的結果。
例如,DeepMind的阿爾法狗程序擊敗了該研究中心此前的一項努力,即利用強化學習和對人類遊戲中的標記數據的研究來學習圍棋。
但是這種“純粹的”方法通常需要更多的計算能力,這使得它對于大型組織或政府之外的研究人員來說太昂貴了。
主要競賽組織者、卡內基梅隆大學(Carnegie Mellon University)博士生威廉•古斯(William Guss)向英國廣播公司(BBC)表示,競賽的目的在于表明,“對我們來說,將大規模計算用于解決問題,未必是推動這一領域發展的正確方式”。
他補充道:“它直接阻礙了對這些強化學習系統的民主化訪問,並將在複雜環境中培訓代理人的能力留給了擁有大量計算能力的企業。”
但這一結果可能有助于突顯這些資金充足的實體所具有的優勢。