鄔光亞:人工智能引領(lǐng)進(jìn)入新時(shí)代 圍棋即博弈

責(zé)任編輯:zsheng

2018-08-31 13:42:26

摘自:新浪體育

自AlphaGo在2016年3月正式進(jìn)入人們的視野,至今已兩年有余。僅僅兩年,它已經(jīng)對(duì)所有職業(yè)棋手乃至整個(gè)圍棋界產(chǎn)生了顛覆性的影響,而且我認(rèn)為這種影響還將持續(xù)幾十年、上百年。

自AlphaGo在2016年3月正式進(jìn)入人們的視野,至今已兩年有余。僅僅兩年,它已經(jīng)對(duì)所有職業(yè)棋手乃至整個(gè)圍棋界產(chǎn)生了顛覆性的影響,而且我認(rèn)為這種影響還將持續(xù)幾十年、上百年。

如果說(shuō)吳清源大師教會(huì)了我們布局的思想性與靈活多變,李昌鎬老師讓我們重新審視謹(jǐn)慎嚴(yán)密對(duì)于勝負(fù)的重要性,那么AlphaGo則讓我們?nèi)娴闹匦吕斫鈬濉?/p>

圍棋是基于判斷的博弈。下棋時(shí)的每一步?jīng)Q策都包含著各種判斷,對(duì)厚薄的判斷、強(qiáng)弱的判斷、急所的判斷、甚至還有對(duì)棋盤對(duì)面對(duì)手的種種判斷。圍棋自規(guī)則形成以來(lái)發(fā)展了上千年,但是棋盤上價(jià)值的判斷從未統(tǒng)一過(guò)(也許在某個(gè)時(shí)期曾短暫統(tǒng)一,但隨后又會(huì)被新的觀念取代),我想今后也難以被統(tǒng)一。畢竟棋盤上的價(jià)值觀很大程度上取決于下棋者的世界觀,試問(wèn)世界觀可以被統(tǒng)一嗎?

說(shuō)回阿爾法的價(jià)值觀。圍棋的本質(zhì)是效率,雙方一人一手,誰(shuí)的效率高自然占到的地盤就比對(duì)方多。而角部無(wú)論是獲得安定還是占據(jù)交叉點(diǎn)都是效率最高的,先人“金角銀邊草肚皮”的格言千年未破。所以阿爾法的布局都是圍繞著角部展開(kāi)的。

阿爾法自進(jìn)化到master版本時(shí)就有了開(kāi)局點(diǎn)三三的下法,Zero之后更是盤盤點(diǎn)三三,這給了我們一個(gè)他非常喜愛(ài)實(shí)地的印象。但AI真的有目數(shù)(實(shí)地)這個(gè)概念嗎?即使有,判斷方法和人類也肯定不一樣。所以我覺(jué)得點(diǎn)三三首先是因?yàn)樾?,其次是要?zhēng)奪根據(jù)地。從人類頂尖高手到阿爾法所有版本再到現(xiàn)在的所有高水平AI,對(duì)雙方根據(jù)地的敏感是大家的共同特點(diǎn)。

AlphaGo下的最多的一步棋我想大概就是“肩沖”了吧。一般來(lái)講肩沖就是把子下在對(duì)方棋子的斜對(duì)角,若即若離,在我看來(lái)包括點(diǎn)三三在內(nèi)的類似招法都可以叫做“肩沖”。這類棋的特點(diǎn)就是雙方各取一邊,和平共處,所以我覺(jué)得阿爾法的棋也可以稱作“相生之棋”。現(xiàn)在學(xué)習(xí)了阿爾法算法的頂尖AI,也無(wú)一不是這種風(fēng)格:很少主動(dòng)攻擊對(duì)方的孤子,更多的時(shí)候是在各自發(fā)展,不會(huì)下出讓對(duì)手無(wú)路可走的棋來(lái)。(當(dāng)然也是因?yàn)樗麄兊墓伦佣己茌p或很有彈性的緣故)。反觀人類棋手,就只好稱作“相殺之棋”了吧。一是因?yàn)槿祟愰L(zhǎng)久以來(lái)的習(xí)性,二則多數(shù)時(shí)候人類實(shí)在是判斷不清形勢(shì),只好先下最強(qiáng)硬的再說(shuō)。如此一來(lái)往往在一個(gè)小地方就戰(zhàn)的不可開(kāi)交。

從前的人們一定難以想象會(huì)是人工智能打開(kāi)了圍棋領(lǐng)域的又一扇大門,而若干年后回望今天,說(shuō)起那個(gè)圍棋的新時(shí)代,人們會(huì)講起新的探索之路是由一個(gè)名為AlphaGo的人工智能所引領(lǐng)的。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號(hào)-6京公網(wǎng)安備 11010502049343號(hào)