辛頓驚訝的道:“你們攻克了《打磚塊》?”
哈薩比斯眉開眼笑的道:“沒錯!”
“快演示給我看看!”辛頓頗為激動。
從上個世紀50年代人工智慧剛形成概唸的時候起,遊戲始終都是人工智慧的重要測試手段。
早在1990年的時候,人工智慧就在跳棋項目上擊敗了人類世界冠軍。
1997年,ibm的超級計算機“深藍”擊敗了國際象棋世界冠軍卡斯帕羅夫。
2011年,另一台ibm計算機“沃森”在遊戲《危險邊緣》中擊敗了所有人類玩家。
deep
mind也試圖從遊戲項目入手挖掘人工智慧的潛力,他們開發出了一個會玩遊戲的人工智慧,主要目標瞄準了雅達利遊戲。
雅達利是一種上世紀80年代流行一時的主機,曾經是遊戲市場的霸主,卻由於推出了一款史上最垃圾的遊戲《et》而一蹶不振,最後被任天堂的fc取而代之。
但在很多歐鎂人的心中,雅達利遊戲依然是經典,其中最出名的幾款遊戲《太空入侵者》、《乒乓》和《打磚塊》都被deep
mind列入人工智慧的攻克名單。
來到演示電腦前,螢幕上正在進行著一場《打磚塊》遊戲,沒有人操控,擋板自動的在螢幕下方遊走,一次又一次的把小球彈向上方磚牆。
哈薩比斯道:“弗拉德,你來給大家講解一下吧。”弗拉德·姆尼是deep
mind的資深工程師,這台正在打磚塊的人工智慧係統正是他率領團隊做出來的,聞言點了點頭道:“諸位,我們使用一種全新的深度神經網絡構造方法,製作出了這個係統。通過反覆試錯來學習《打磚塊》的遊戲方法和每一種擊球角度的細微差别,目前已經玩了局遊戲,係統已經能夠分析出哪一種動作是有效擊打,哪一種是無效擊打,我們稱這種學習方式為強化學習。”
“在最初的係統中,它需要300個小時以上,才能精通這款遊戲,並且通關。經過我們不斷調整演算法和結構之後,它現在已經能夠在30分鐘之內學會遊戲的基本規則,1個小時達到普通玩家的熟練度,每次都能準確的接到小球命中磚塊,2個小時候它就學會了進階技巧,能夠找準角度把球打入磚塊後的狹窄空間,利用小球在磚塊之前的反彈碰撞快速得分。”
“目前,這個係統在遊戲中的得分已經超越了deep
mind的所有人。”姆尼最後的一句話發人深省。
辛頓一直靠在牆邊安靜的聽著,直到此時問道:“所以你們的係統真的是每一次都從頭學習打磚塊的遊戲技能?”
姆尼道:“沒錯。我們隻是設定了一個目標,比如得到最高的分數,它就可以自動試錯和學習,製訂一些獨特的遊戲策略。這些策略的最終目標就是得到最高分。然後,它每次都能成功,隻是每一次耗費的時間越來越短。”
“真是令人震驚……”辛頓喃喃道。
李睿儘管早就知道人工智慧會在十年後掀起狂風巨浪,也依然和辛頓一樣,受到了深深的震撼。-