西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
軟件
軟件
文章
搜索

首頁業(yè)內(nèi)動(dòng)態(tài) 業(yè)內(nèi)資訊 → 新 AlphaGo 跟老 AlphaGo有什么不同 柯潔 vs AlphaGo圍棋對(duì)決看點(diǎn)介紹

新 AlphaGo 跟老 AlphaGo有什么不同 柯潔 vs AlphaGo圍棋對(duì)決看點(diǎn)介紹

相關(guān)軟件相關(guān)文章發(fā)表評(píng)論 來源:西西整理時(shí)間:2017/5/23 9:28:24字體大。A-A+

作者:西西點(diǎn)擊:0次評(píng)論:0次標(biāo)簽: 新AlphaGo 老AlphaGo

  • 類型:影音播放大小:14.3M語言:中文 評(píng)分:10.0
  • 標(biāo)簽:
立即下載

人工智能和人類大腦的終極對(duì)決在5月23日正式展開,這次的對(duì)決的項(xiàng)目還是圍棋,中國(guó)作為傳統(tǒng)的圍棋故鄉(xiāng),其實(shí)力是毋庸置疑的,下面我們就分析一下人工智能 AlphaGo,感興趣的網(wǎng)友們,趕緊過來看看。

柯潔 vs AlphaGo圍棋對(duì)決現(xiàn)場(chǎng)直播下載地址:http://www.innovatechautomation.com/soft/491072.html

新 AlphaGo 跟老 AlphaGo有什么不同

作為一個(gè)從 2014 年發(fā)展至今的圍棋人工智能項(xiàng)目,其實(shí) AlphaGo 在發(fā)展歷程中使用過多個(gè)名字,比如最早期亦城圍棋上的 “DeepMind”,又或者是之前在野狐平臺(tái)上的 “Master”。那么這次的 “新 AlphaGo” 是否也只是一個(gè)新名字?

答案必然是否定的,之前起新名字很可能有保密、個(gè)人喜好等原因,但這次新添加的 “新” 字只為了突出一點(diǎn)——這是 “機(jī)器自學(xué)” 為主的一版 AlphaGo。

這一點(diǎn)判斷的線索,來自于今年初,Master 在網(wǎng)絡(luò)上一口氣橫掃 60 名人類棋手的時(shí)候。當(dāng)時(shí) Master 第二次戰(zhàn)勝柯潔之后,棋圣聶衛(wèi)平曾表示:

Master 改變了我們傳統(tǒng)的厚薄理念,顛覆了多年的定式。圍棋遠(yuǎn)不像我們想象的那么簡(jiǎn)單,還有巨大的空間等著我們?nèi)祟惾ネ诰,阿法狗也好,Master 也罷,都是‘圍棋上帝’派來給人類引路的。

著名棋手古力在成為 Master 的第 60 個(gè)手下敗將,之后,也在微博發(fā)表了自己的感受:

作為第 60 個(gè)勇士,犧牲了。。。經(jīng)過這幾天的對(duì)局,我深深的感受到圍棋的神秘,似乎 Master 給我們打開一道圍棋的神秘之門,不論勝負(fù),人類與人工智能共同探索圍棋世界的大幕即將拉開,新一次的圍棋革命正在進(jìn)行著。。。

這種表現(xiàn),與將近一年前的 “老 AlphaGo” 可謂天差地別。想要達(dá)成這樣的成績(jī)只有一種可能——DeepMind 尋找到了一種機(jī)制來擺脫圍棋中的 “人類束縛”。

迷之改進(jìn):一舉讓 AlphaGo 成為人類老師

作為一個(gè)極其特殊的棋類和任務(wù),圍棋擁有數(shù)量極其龐大的可能性,總的局面數(shù)量達(dá)到 10^172,而可觀測(cè)宇宙范圍內(nèi)的原子數(shù)量不過 10^80。這也意味著窮舉絕對(duì)不是一條明智的路線。

最終 DeepMind 給出了一套能夠 “模擬” 出人類頂尖高手的方案:深度學(xué)習(xí) + 蒙特卡洛搜索樹 + 自我進(jìn)化。

這一套架構(gòu)在 DeepMind 發(fā)布在《自然》雜志中的論文中已經(jīng)有詳細(xì)敘述,

(https://www.nature.com/nature/journal/v529/n7587/full/nature16961.html)

如果你對(duì)其中的細(xì)節(jié)感興趣,推薦閱讀國(guó)內(nèi)人工智能創(chuàng)業(yè)公司彩云 AI 創(chuàng)始人、CEO 袁行遠(yuǎn)在知乎上的相應(yīng)回答。

(https://www.zhihu.com/question/41176911/answer/90118097)

深度學(xué)習(xí)用以分析人類棋盤,蒙特卡洛搜索樹用來減輕工作量,自我進(jìn)化用來提升能力。但有限的運(yùn)算能力還是給 DeepMind 出了一個(gè)不小的難題,后者最終想出了一個(gè)辦法:只對(duì)學(xué)習(xí)到的人類棋招進(jìn)行蒙特卡洛搜索樹運(yùn)算,這恰如人類棋手依賴定式。

定式,又名定石,指的是人類下圍棋長(zhǎng)久積累下來的一種經(jīng)驗(yàn),對(duì)弈雙方在特定情況下會(huì)遵循固定下法。著名棋手吳清源則將簡(jiǎn)單描述為 “在角部彼我棋子接觸時(shí)最合理的走法”。

這些定式被記載在各式各樣的棋譜當(dāng)中,成為新手入門必看的書籍。

雖然定式是某種意義上是最合理的走法,但它卻是理想化條件下的產(chǎn)物,想要完整復(fù)現(xiàn)定式,意味著雙方都必須抱有同樣的理想化思路。而歷史上并不缺乏不遵守定式,或者用新定式打敗對(duì)方的事例。

問題來了,為什么千變?nèi)f化的圍棋會(huì)出現(xiàn)定式?而且死守定式會(huì)輸,不學(xué)習(xí)定式也會(huì)輸。答案只有一個(gè)——人類需要定式來減少圍棋上面的變化,這樣進(jìn)入中盤之后人類才能利用自身能力掌握棋局走向。

湊巧的是,這回我們遇到的是運(yùn)算能力遠(yuǎn)超人類的計(jì)算機(jī),讓掌握更多乃至全部圍棋奧秘?fù)碛辛艘唤z可能。

但究竟新 AlphaGo 怎么樣擺脫 “人類束縛”?參考之前 “老 AlphaGo” 的工作方式,排除運(yùn)算過程中所有人類元素可能是最徹底的方法。但這樣一來就必須找到另外一種減輕運(yùn)算壓力的策略。目前來看,這個(gè)秘密也只能等 DeepMind 方面稍后公開了。

    相關(guān)評(píng)論

    閱讀本文后您有什么感想? 已有人給出評(píng)價(jià)!

    • 8 喜歡喜歡
    • 3 頂
    • 1 難過難過
    • 5 囧
    • 3 圍觀圍觀
    • 2 無聊無聊

    熱門評(píng)論

    最新評(píng)論

    發(fā)表評(píng)論 查看所有評(píng)論(0)

    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    字?jǐn)?shù): 0/500 (您的評(píng)論需要經(jīng)過審核才能顯示)