數 理 人 文 10 60 棋程式是在數百萬至數十億個棋步及應步的組合中 搜尋。程式的目標是無論對手走哪一步,都要能隨 即找到使我方棋勢(board position)價值極大化的 下一步棋 1。 早期西洋棋程式評估棋勢的概念比較簡單,例如 「一個主教等於三個士兵」,但晚近的程式則融入 更多精細的西洋棋知識。譬如深藍在評估棋勢時, 使用的函數包含了8,000 多個因子。它不會單純將 一個城堡等同於五個士兵,如果城堡前方有同色士 兵阻礙城堡的移動,城堡的子力就會略降。然而, 若這個士兵能「槓桿化」(levered),也就是能藉 由吃掉敵方士兵而打開城堡的動線,深藍會將這枚 士兵視為半透明,城堡子力所受到的影響將會更小。 這樣的概念有賴精細的西洋棋知識,而這正是深 藍成功的關鍵。根據深藍小組的技術報告,將槓桿 化士兵視為半透明的概念,在深藍第二次與卡斯帕 羅夫對奕時起了決定性的作用。 深藍研發人員最終運用了兩大想法。第一,建立 一個融合大量西洋棋精細知識的函數,可用來評估 任何棋勢;第二,運用強大的計算能力分析各種可 能的陣式,找出導向最佳棋勢的棋步。 如果套用這個策略在圍棋上,結果會是如何? 你會發現執行時有很大的問題。主要問題出在盤 面難以估算。頂尖圍棋棋士通常大量運用直覺來評 估盤面的優劣。舉例而言,他們對於擁有「好形」 的盤面只能提出約略的陳述,這種直覺不容易用簡 單明確的方式表達,和西洋棋計算子力的方式差異 1997 年,IBM 研發的電腦「深藍」打敗西洋棋 世界冠軍卡斯帕羅夫(Garry Kasparov)。這場勝 利當時被廣譽為人工智慧發展的里程碑,但深藍電 腦似乎只會下西洋棋而少有其他功能,電腦科技並 未因此有革命性進展。最近打敗圍棋史上頂尖高手 的人工智慧系統AlphaGo,會有所不同嗎? 我相信是有的,但原因可能跟你聽到的不一樣。 多數報章引述專家言論,說圍棋比西洋棋困難,所 以這對電腦來說是場了不起的勝仗;也有人指稱原 本預期電腦要再過十年才能打敗人類棋手,因此這 次是一大突破。有些文章則(正確地)觀察到圍棋 比起西洋棋有更多可能的棋步,但並沒有解釋為什 麼這會成為電腦較難以勝過人類的原因。 換句話說,這些論述都沒有觸及核心問題─導 致AlphaGo 勝利的科技創新,是否能有更廣泛的 應用?要回答這個問題,首先需理解,AlphaGo 所 運用的創新科技和深藍系統相較,本質上大為不 同,且重要性更高。 西洋棋初學者首先要知道各種棋子的價值(子 力):一個騎士或主教相當於三個士兵;城堡的移 動範圍較大,值五個士兵;擁有最大移動範圍的皇 后可抵九個士兵;而國王是無價的,因為輸掉國王 就輸了。 你可以依這些子力來盤算可能的棋步。捨棄主教 來吃掉對手的城堡是個好策略;但只為了換一個城 堡,卻同時捨棄騎士和主教,似乎就不太划算。 子力的概念對西洋棋軟體非常重要。大多數西洋
AlphaGo 這麼了不起嗎?
捕捉人類直覺的圍棋程式可望帶來深遠影響
作者:尼爾森 Michael Nielsen 譯者:林奕君 尼爾森是來自澳洲現居於紐約的物理學家、程式研究人員、科學作者。他的著作觸及量子計算、開放科學與深層學習等主題。Quanta是西蒙斯基金會(Simons Foundation)出版但編輯獨立之網路科普雜誌(http://www.quantamagazine.org/),希望能提高數學、物理與
生命科學前沿研究進展的公眾能見度。本文譯自:https://www.quantamagazine.org/20160329-why-alphago-is-really-such-a-big-deal/