„AlphaGo” változatai közötti eltérés

Innen: Go Wiki
Ugrás a navigációhozUgrás a kereséshez
(Új oldal, tartalma: „A Google deaplearning-et és egyéb klasszikus technikákat ötvözö programja. A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket…”)
 
3. sor: 3. sor:
 
A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a mássikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési statisztikát ért el.
 
A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a mássikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési statisztikát ért el.
  
A program megverte [[Fan Hui]]-t az aktuális Európa bajnokot 5-ből 5 ször.
+
A program megverte [[Fan Hui]]-t az aktuális Európa bajnokot 5-ből 5 ször. Márciusban játszik [[Lee Sedol]]-lal.
  
 
* http://www.technologyreview.com/news/546066/googles-ai-masters-the-game-of-go-a-decade-earlier-than-expected/
 
* http://www.technologyreview.com/news/546066/googles-ai-masters-the-game-of-go-a-decade-earlier-than-expected/
 
* http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
 
* http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html
 +
* https://youtu.be/g-dKXOlsf98

A lap 2016. január 28., 08:28-kori változata

A Google deaplearning-et és egyéb klasszikus technikákat ötvözö programja.

A program két neurális deaplearning-el tanult neurális hálót használ, az egyiket az adott állás kiértékelésére, a mássikat a lehetséges lépések előrejelzésére, majd ezeket kombinálja egy Monte Carlo alogritmussal. Ezzel a jelenlegi (2016 jan) programok ellen 99.8%-os nyerési statisztikát ért el.

A program megverte Fan Hui-t az aktuális Európa bajnokot 5-ből 5 ször. Márciusban játszik Lee Sedol-lal.