AlphaGo

A Go Wiki wikiből

A Google deaplearning-et és egyéb klasszikus technikákat ötvöző programja.

A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a másikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési (499-1) statisztikát ért el.

A program megverte az utóbbi 3 év Európa bajnokát Fan Hui 2p-t 5-ből 5 ször. 2ö16 márciusában megverte Lee Sedol-t 4-1-re, a partik megtekinthetők YouTube-on: https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A

Fan Hui elleni ötödik parti[szerkesztés]

Fekete   : Fan Hui
Fehér    : AlphaGo
Handicap : 0
Komi     : 7.5
Esemény  : W+R

90 @ 15, 127 @ 37, 151 @ 141, 154 @ 148, 157 @ 141, 160 @ 148, 163 @ 141


Külső hivatkozások[szerkesztés]