„AlphaGo” változatai közötti eltérés

Innen: Go Wiki
Ugrás a navigációhozUgrás a kereséshez
3. sor: 3. sor:
 
A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a másikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési (499-1) statisztikát ért el.
 
A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a másikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési (499-1) statisztikát ért el.
  
A program megverte az utóbbi 3 év Európa bajnokát [[Fan Hui]] 2p-t 5-ből 5 ször. Márciusban játszik [[Lee Sedol]]-lal.
+
A program megverte az utóbbi 3 év Európa bajnokát [[Fan Hui]] 2p-t 5-ből 5 ször. 2ö16 márciusában megverte [[Lee Sedol]]-t 4-1-re, a partik megtekinthetők YouTube-on: https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A
  
=== Az ötödik parti ===
+
=== Fan Hui elleni ötödik parti ===
  
 
<godiagramleft>
 
<godiagramleft>

A lap 2016. március 18., 14:35-kori változata

A Google deaplearning-et és egyéb klasszikus technikákat ötvöző programja.

A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a másikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési (499-1) statisztikát ért el.

A program megverte az utóbbi 3 év Európa bajnokát Fan Hui 2p-t 5-ből 5 ször. 2ö16 márciusában megverte Lee Sedol-t 4-1-re, a partik megtekinthetők YouTube-on: https://www.youtube.com/channel/UCP7jMXSY2xbc3KCAE0MHQ-A

Fan Hui elleni ötödik parti

Fekete   : Fan Hui
Fehér    : AlphaGo
Handicap : 0
Komi     : 7.5
Esemény  : W+R

90 @ 15, 127 @ 37, 151 @ 141, 154 @ 148, 157 @ 141, 160 @ 148, 163 @ 141


Külső hivatkozások