etiqueta: reinforcement learning

IMAGE: Peerayot To-im - 123RF

Entendiendo AlphaGo Zero

Explicar la noticia de hace unos pocos días sobre AlphaGo Zero, el último avance en el algoritmo que fue capaz de ganar con gran ventaja a los tres mejores jugadores del mundo de Go, el llamado «ajedrez asiático», con unas reglas aparentemente muy sencillas pero con posibilidades combinatorias enormemente
4

Algunas reflexiones sobre el machine learning, el Go… y lo que viene después

La reciente victoria de AlphaGo, el modelo de machine learning creado por Google para jugar al Go, frente a Lee Sedol, el mejor jugador del mundo, por 4 partidas a 1 (en la imagen, el tablero al final de la cuarta partida, la única que ganó el jugador
24