圍棋真的是人類的最后一道壁壘么?小白為你科普人工智能那些事!
小時候追著看過《終結者》,上學時候拿著手中的文曲星在國際象棋里信誓旦旦的挑戰著一個叫深藍的怪人,突然有一天,一個叫alphaGo的家伙贏了另一個叫李世石的圍棋冠軍。這個時候,有人說,那,就是人工智能。這個詞,就好像突然冒出來了一樣,但是一瞬間,就鋪天蓋地而來。前兩天又看到新聞,說alphaGo被另一個能夠自學的alphaZero以100比0完虐,更是讓朋友圈被刷屏了一波。人工智能超過人腦的計算能力和超過人力的控制能力再一次驚艷了世界。
人工智能是計算機科學的一個分支,它企圖了解智能的實質,并生產處一種新的能以人類只能相似的方式做出反應的智能機器。所以,簡而言之,它的目標是能夠像人類一樣的思考、判斷,模擬人的行為甚至超越人的行為。
但是為什么是圍棋一下子就讓人工智能火了?為什么不是五子棋?或者象棋?其實,這要從圍棋的復雜度說起。在過去的二三十年里,國際象棋、挑起、黑白棋、撲克牌等領域紛紛被人工智能拿下,唯獨圍棋是個例外。
首先,圍棋是一個19X19=361個點的棋盤,棋盤遠大于其他棋類,庫卡機器人,計算起來,可能有10的170次方的走法,這個數字甚至大于宇宙中原子的數量,而同為棋類的國際象棋可能也只有10的70次方左右。
其次,棋盤的每個棋子在落子前子力是相同的,也就是說不會有象棋一樣車馬炮的大小之分,每一個子地位平等,不會因為一子定勝負,但是卻又牽一發而動全身,需要全局的決策。機器的算法源于規則,KUKA機器人示教器維修,而圍棋的規則并不能用簡單的數學的賦權值的方法去判斷。
再而,圍棋的落子地點沒有限制,棋盤上任何一個點都有黑、白、空三種可能。
傳統的計算機算法是將所有可能的走法建立成一個搜索樹,盡可能去猜測所有的可能情況從而選出最優選,通過窮舉作出判斷。但這種方法對于復雜性超高的圍棋則不適合,除了以上的幾個方面,也同時因為圍棋可以在任意一個階段計算勝率,alphaGo的做法是對棋盤進行模擬,采用搭建類似于大腦神經網絡的方式,工業機器人維修,一方面選擇下一步走法,也即策略網絡,一方面預測比賽的勝利,也即價值網絡。而alphaZero更進一步,將兩個網絡合二為一。而且只設定圍棋基本規則,從隨機游戲開始,完全自我訓練強化,消除了人工智能依賴于大量數據集訓練的難題。