AlphaGo

Innen: Go Wiki
A lap korábbi változatát látod, amilyen Stone (vitalap | szerkesztései) 2016. január 28., 20:03-kor történt szerkesztése után volt.
Ugrás a navigációhozUgrás a kereséshez

A Google deaplearning-et és egyéb klasszikus technikákat ötvözö programja.

A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a mássikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési (499-1) statisztikát ért el.

A program megverte Fan Hui-t az aktuális Európa bajnokot 5-ből 5 ször. Márciusban játszik Lee Sedol-lal.

Az öt parti

Fekete   : Fan Hui
Fehér    : AlphaGo
Handicap : 0
Komi     : 7.5
Esemény  : W+R

90 @ 15, 127 @ 37, 151 @ 141, 154 @ 148, 157 @ 141, 160 @ 148, 163 @ 141


Külső hivatkozások