AlphaGo

A Go Wiki wikiből

A Google deaplearning-et és egyéb klasszikus technikákat ötvöző programja.

A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a másikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési (499-1) statisztikát ért el.

A program megverte az utóbbi 3 év Európa bajnokát Fan Hui 2p-t 5-ből 5 ször. 2016 márciusában megverte Lee Sedol-t 4-1-re, a partik megtekinthetők YouTube-on: https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A

2017 Májusában a Future of Go Summit Kínai rendezvényen 3 partiból álló összecsapása volt Ke Jie ellen. Az első partit megnyerte fél ponttal, a másik kettőben feladásra kényszerítette ellenfelét.

2016-12-29 és 2017-01-05 között Magist és Master(P) nevek alatt a Tygem és Foxy szervereken 60 partit játszott magas rangu profik ellen, mindet megnyerte (egy partinál az ellenfél lecsatlakozott és így döntetlen lett). Ez a verzió az Alpha Go Master lényegesen erősebb az eredeti Lee Sedol-t megverő programnál, sőt a gépigénye is jóval kevesebb.

2017-ben Alpha Go Zero néven egy olyan verziót mutattak be aki minden eddiginél erősebb, és teljesen magátol tanult meg játszani nem látott előtte emberi partit. Sokak szerint épp ezért néha földöntúli a stílusa, fölé emelkedett az embereknek.

Leela Zero néven nyilt forrásu go program jött létre az Alpha Go leírásai alapján.

Fan Hui elleni ötödik parti[szerkesztés]

Fekete   : Fan Hui
Fehér    : AlphaGo
Handicap : 0
Komi     : 7.5
Esemény  : W+R

90 @ 15, 127 @ 37, 151 @ 141, 154 @ 148, 157 @ 141, 160 @ 148, 163 @ 141


Külső hivatkozások[szerkesztés]