人機(jī)圍棋大戰(zhàn)首局落定：李世石投子認(rèn)輸！

時(shí)間: 2016-03-10 11:04:46 點(diǎn)擊數(shù): 30246 來(lái)源: 耐思智慧

圖文直播全程回顧

新浪科技訊北京時(shí)間3月9日下午消息，今天下午谷歌人工智能AlphaGo與韓國(guó)棋手李世石的第一場(chǎng)比賽結(jié)束，AlphaGo獲得今日比賽的勝利。雙方在較量3個(gè)半小時(shí)后，李世石宣布認(rèn)輸。今日比賽結(jié)束后，雙方還將分別在3月10日(周四)、12日(周六)、13日(周日)、15日 (周二)的北京時(shí)間中午12點(diǎn)進(jìn)行剩余4場(chǎng)比賽。

本次比賽用時(shí)每方2小時(shí)，1分鐘讀秒三次。比賽采用中國(guó)規(guī)則，黑貼3又3/4子(黑貼7目半)。采用中國(guó)規(guī)則是因Alpha GO以中國(guó)規(guī)則為基礎(chǔ)開(kāi)發(fā)。

比賽采用5局3勝制，最終比賽獲勝方將獲得獎(jiǎng)金100萬(wàn)美元。如果AlphaGo獲勝，獎(jiǎng)金將捐贈(zèng)給聯(lián)合國(guó)兒童基金會(huì)(UNICEF)，STEM教育，以及圍棋慈善機(jī)構(gòu)(Go Charity)。

AlphaGo開(kāi)發(fā)者DeepMind公司在今年1月的學(xué)術(shù)雜志《Nature》刊登封面文章，展示了圍棋人工智能領(lǐng)域突破性進(jìn)展的詳細(xì)情況。這次對(duì)弈中，坐在李世石對(duì)面正是《Nature》封面文章作者之一黃士杰(Aja Huang)，他本人來(lái)代替AlphaGo在棋盤上落子。AlphaGo一方的旗幟是英國(guó)國(guó)旗，因?yàn)檫@次參賽的谷歌圍棋程序AlphaGo來(lái)自英國(guó)人工智能公司DeepMind。

谷歌AlphaGo在第一次與世界優(yōu)質(zhì)圍棋手的較量中取得勝利，這是人工智能發(fā)展史上重要的里程碑，代表人工智能已經(jīng)能在諸如圍棋等高度復(fù)雜的項(xiàng)目中發(fā)揮出超過(guò)人類的作用。

AlphaGo與李世石對(duì)戰(zhàn)棋譜(李世石執(zhí)黑)

一般來(lái)說(shuō)，現(xiàn)在的職業(yè)圍棋高手喜歡下白棋，但李世石有些出人意料地第一盤選擇了執(zhí)黑先行。很快李世石給出了理由，黑棋布局走出了一個(gè)新型，阿爾法的應(yīng)對(duì)不佳，有些虧損。李世石顯然研究了電腦圍棋的理論，得出了電腦在布局階段不太擅長(zhǎng)應(yīng)對(duì)新型的推論，棋局的進(jìn)行證明了這一點(diǎn)，李世石有備而來(lái)。

不過(guò)圍棋決定勝負(fù)的往往是中盤階段，阿爾法似乎也“意識(shí)”到了自己形勢(shì)不佳，之后的下法選擇得非常強(qiáng)硬，雙方早早就展開(kāi)了接觸戰(zhàn)。電腦的下法令觀戰(zhàn)的職業(yè)棋手目瞪口呆，幾乎招招都是最佳應(yīng)對(duì)。好在戰(zhàn)斗也是李世石的強(qiáng)項(xiàng)，雙方就像武林高手，猛對(duì)幾掌，然后各自退了好幾步。

不過(guò)在第一個(gè)戰(zhàn)役結(jié)束之后，電腦的選擇令人費(fèi)解。正常高手，對(duì)掌之后，總要運(yùn)氣緩一下，然后再打，電腦的下法則是直接又撲上來(lái)了。過(guò)剛易折，這處的戰(zhàn)役，李世石抓住機(jī)會(huì)，圍住一塊大空。人族代表心里有底了，電腦雖然在局部戰(zhàn)斗表現(xiàn)出色，但在大局上似乎不如人類高瞻遠(yuǎn)矚。

不過(guò)作為人類最大弱點(diǎn)是會(huì)受情緒波動(dòng)的影響，取得優(yōu)勢(shì)后，李世石的心態(tài)似乎發(fā)生了變化，右下角黑棋下得太過(guò)保守，白棋左右逢源，角部做活，大龍也及時(shí)補(bǔ)棋，黑棋一無(wú)所得，此前的優(yōu)勢(shì)消失殆盡。各路講解的職業(yè)棋手判斷也出現(xiàn)了分歧，不過(guò)隨著棋局進(jìn)入官子階段，大家發(fā)現(xiàn)李世石其實(shí)敗局已定。

最終李世石投子認(rèn)負(fù)，表情上看上去不是很痛苦，不知是不是找到了電腦的弱點(diǎn)？

谷歌為何要做人工智能圍棋程序AlphaGo

谷歌并不只是想做一個(gè)棋類程序，而是想做一個(gè)通用的智能計(jì)算系統(tǒng)。如果解決了圍棋問(wèn)題，谷歌希望能把這套人工智能算法用于災(zāi)害預(yù)測(cè)、風(fēng)險(xiǎn)控制、醫(yī)療健康和機(jī)器人等復(fù)雜領(lǐng)域。也就是說(shuō)谷歌的目的還是為了更好的服務(wù)人類，沒(méi)有任何惡意。DeepMind(AlphaGo的研究公司)創(chuàng)始人哈薩比斯說(shuō)：公眾對(duì)人工智能的警示掩蓋了人工智能帶來(lái)的幫助。距離人腦水平的人工智能仍然相當(dāng)遙遠(yuǎn)，可能還需要幾十年。

在昨天的賽前發(fā)布會(huì)上，谷歌董事長(zhǎng)施密特表示，輸贏都是人類的勝利。因?yàn)檎侨祟惖呐Σ抛屓斯ぶ悄苡辛爽F(xiàn)在的突破。

但并不是所有人都會(huì)對(duì)人工智能持樂(lè)觀態(tài)度。諸如特斯拉CEO馬斯克、理論物理學(xué)家霍金等科技界的名人就對(duì)此產(chǎn)生了擔(dān)憂。

圍棋復(fù)雜度超過(guò)宇宙原子總數(shù)

圍棋棋盤橫豎各有19條線，共有361個(gè)落子點(diǎn)，雙方交替落子，這意味著圍棋總共可能有10^171(1后面有171個(gè)零)種可能性。這個(gè)數(shù)字到底有多大，你可能沒(méi)有感覺(jué)。我們可以告訴你，宇宙中的原子總數(shù)是10^80(1后面80個(gè)零)，即使窮盡整個(gè)宇宙的物質(zhì)也不能存下圍棋的所有可能性。

19年前，IBM公司的“深藍(lán)”計(jì)算機(jī)戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫，引起了巨大轟動(dòng)。但是因圍棋的復(fù)雜度，直到近期，人類才在圍棋人工智能項(xiàng)目上取得重大突破。

由于圍棋的可能性如此之多，根本就沒(méi)有什么套路可言。下贏圍棋的唯一的辦法就是讓電腦也學(xué)會(huì)“學(xué)習(xí)”，而不是死記硬背。為了在圍棋上戰(zhàn)勝人類，硅谷的兩家科技公司——Facebook和谷歌開(kāi)始研究，希望有朝一日能讓計(jì)算機(jī)戰(zhàn)勝人類圍棋冠軍。

李世石簡(jiǎn)介

李世石與AlphaGo對(duì)弈

李世石是李昌鎬之后，韓國(guó)最具代表性的棋手，他在2003年獲第16屆富士通杯冠軍后升為九段棋手。自2002年加冕富士通杯以來(lái)，十年時(shí)間里他共獲18個(gè)世界冠軍。李世石屬于典型的力戰(zhàn)型棋風(fēng)，善于敏銳地抓住對(duì)手的弱處主動(dòng)出擊，以強(qiáng)大的力量擊垮對(duì)手，他的攻擊可以用“穩(wěn)，準(zhǔn)，狠”來(lái)形容，經(jīng)常能在劣勢(shì)下完成逆轉(zhuǎn)。

AlphaGo去年10月?lián)魯W洲冠軍

谷歌曾于2014年以4億歐元收購(gòu)人工智能公司DeepMind。由DeepMind研發(fā)的AlphaGo項(xiàng)目已有兩年歷史，AlphaGo曾在去年戰(zhàn)勝了歐洲圍棋冠軍樊麾(職業(yè)二段)。

去年10月5日-10月9日，谷歌AlphaGo在比賽中以5：0的比分完勝了歐洲冠軍。除了戰(zhàn)勝人類外，AlphaGo還與其他的圍棋程序?qū)?zhàn)，獲得了500場(chǎng)勝利。

AlphaGo原理簡(jiǎn)介

其中一個(gè)神經(jīng)網(wǎng)絡(luò)“決策網(wǎng)絡(luò)”(policy network)負(fù)責(zé)選擇下一步走法，另一個(gè)神經(jīng)網(wǎng)絡(luò)“值網(wǎng)絡(luò)”(“value network)則預(yù)測(cè)比賽勝利方。谷歌方面用人類圍棋高手的三千萬(wàn)步圍棋走法訓(xùn)練神經(jīng)網(wǎng)絡(luò)，與此同時(shí)，AlphaGo也自行研究新戰(zhàn)略，在它的神經(jīng)網(wǎng)絡(luò)之間運(yùn)行了數(shù)千局圍棋，利用反復(fù)試驗(yàn)調(diào)整連接點(diǎn)，這個(gè)流程也稱為鞏固學(xué)習(xí)(reinforcement learning)，通過(guò)廣泛使用Google云平臺(tái)，完成了大量研究工作。傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)建成一棵搜索樹(shù) ，但這種方法對(duì)圍棋并不適用。此次谷歌推出的AlphaGo，將高級(jí)搜索樹(shù)與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)通過(guò)12個(gè)處理層傳遞對(duì)棋盤的描述，處理層則包含數(shù)百萬(wàn)個(gè)類似于神經(jīng)的連接點(diǎn)。

AlphaGo在與人的對(duì)弈中用了“兩個(gè)大腦”來(lái)解決問(wèn)題：“決策網(wǎng)絡(luò)”和“值網(wǎng)絡(luò)”。通俗來(lái)說(shuō)就是，一個(gè)大腦用來(lái)決策當(dāng)前應(yīng)該如何落子，另一個(gè)大腦來(lái)預(yù)測(cè)比賽最終的勝利方。

值得一提的是，李世石也是第一次與機(jī)器對(duì)戰(zhàn)，所以他無(wú)法像和人類對(duì)戰(zhàn)那樣，先研究對(duì)方的棋譜和下棋風(fēng)格。李世石所能做的就是和自己對(duì)弈。谷歌AlphaGo也是通過(guò)這種方式鍛煉自己，真正做到了“人工智能”。