AlphaGo

Innen: Go Wiki
A lap korábbi változatát látod, amilyen 162.158.89.148 (vitalap) 2016. február 4., 07:38-kor történt szerkesztése után volt.
Ugrás a navigációhozUgrás a kereséshez

A Google deaplearning-et és egyéb klasszikus technikákat ötvöző programja.

A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a másikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési (499-1) statisztikát ért el.

A program megverte az utóbbi 3 év Európa bajnokát Fan Hui 2p-t 5-ből 5 ször. Márciusban játszik Lee Sedol-lal.

Az ötödik parti

Fekete   : Fan Hui
Fehér    : AlphaGo
Handicap : 0
Komi     : 7.5
Esemény  : W+R

90 @ 15, 127 @ 37, 151 @ 141, 154 @ 148, 157 @ 141, 160 @ 148, 163 @ 141


Külső hivatkozások