etiqueta: reinforcement learning

IMAGE: Modified from Jevons paradox - Lawrencekhoo (BB BY-SA)

Deepseek y la paradoja de Jevons

Mi columna en Invertia de esta semana se titula «El avance de la inteligencia artificial y sus complejas implicaciones» (pdf), que escribí el pasado lunes al hilo de la irrupción de Deepseek en el panorama de la inteligencia artificial (en realidad en muchos sitios llevábamos utilizándola
37
IMAGE: Peerayot To-im - 123RF

Entendiendo AlphaGo Zero

Explicar la noticia de hace unos pocos días sobre AlphaGo Zero, el último avance en el algoritmo que fue capaz de ganar con gran ventaja a los tres mejores jugadores del mundo de Go, el llamado «ajedrez asiático», con unas reglas aparentemente muy sencillas pero con posibilidades combinatorias enormemente
4

Algunas reflexiones sobre el machine learning, el Go… y lo que viene después

La reciente victoria de AlphaGo, el modelo de machine learning creado por Google para jugar al Go, frente a Lee Sedol, el mejor jugador del mundo, por 4 partidas a 1 (en la imagen, el tablero al final de la cuarta partida, la única que ganó el jugador
24