新款“阿爾法”再次擊敗人類玩家
2019-01-28 13:58:49 來源:科技日報
繼圍棋“人機大戰”成功擊敗人類頂尖圍棋高手后,谷歌旗下的人工智能技術公司“深層思維”的人工智能程序“阿爾法星”,與人類職業選手在經典即時戰略電腦游戲《星際爭霸2》對戰中,取得壓倒性勝利。
據“深層思維”公司介紹,自去年12月以來,該公司開發的“阿爾法星”人工智能程序與高水平人類職業選手先后舉行了11場比賽。在這一系列“人機大戰”中,人工智能程序最終以10比1擊敗人類選手。只有在1月24日舉行的現場比賽中,“阿爾法星”由于游戲視角受限,人類選手才勉強贏下一場。
“深層思維”公司聯合研發負責人戴維·西爾弗在比賽后指出:“盡管后續還有很多工作要做,但是我希望未來人們在回望今天時,會把這一比賽結果當成人工智能系統的能力又向前邁了一步的表現。”
據介紹,與圍棋棋盤上所有棋子都對雙方可見不同,此類游戲中有“戰爭迷霧”,一方需要猜測和偵察對方的行動,屬于“不完美信息博弈”,并且要求人工智能必須實時做出反應,這對人工智能的要求更高。
“深層思維”公司表示,在“阿爾法星”之前,還沒有任何人工智能系統能夠在《星際爭霸2》中能與人類職業選手的技巧比擬。而“阿爾法星”能夠在這場“人機大戰”中大比分勝出的一個重要基礎,就是它使用了深度神經網絡,研究人員通過監督學習和強化學習的方式,直接利用游戲的原始數據來訓練,以模仿學習的思路,讓模型快速學到高水平人類玩家在游戲中使用的策略和操作。
此外,《星際爭霸2》等游戲中有一個“手速”的概念,用APM(每分鐘操作指令數)來衡量。在基準測試中,“阿爾法星”每分鐘能夠執行約280個操作指令,雖然遠低于人類職業選手,但是其動作更精確,也有助于在比賽中取得勝利。
下贏圍棋、打贏電腦游戲,這都能給人工智能的發展帶來什么呢?“深層思維”的研究團隊認為,訓練“阿爾法星”的先進方法以及算法的先進架構未來都會有助研究人員積累更多經驗,最終設計出能夠應對現實生活中不少復雜問題的人工智能程序,比如天氣預測、氣候模型計算以及語言理解等。(張家偉)
相關閱讀