Enrique Dans

etiqueta: reinforcement learning

Deepseek y la paradoja de Jevons

Mi columna en Invertia de esta semana se titula «El avance de la inteligencia artificial y sus complejas implicaciones» (pdf), que escribí el pasado lunes al hilo de la irrupción de Deepseek en el panorama de la inteligencia artificial (en realidad en muchos sitios llevábamos utilizándola …

Entendiendo AlphaGo Zero

Explicar la noticia de hace unos pocos días sobre AlphaGo Zero, el último avance en el algoritmo que fue capaz de ganar con gran ventaja a los tres mejores jugadores del mundo de Go, el llamado «ajedrez asiático», con unas reglas aparentemente muy sencillas pero con posibilidades combinatorias enormemente …

Algunas reflexiones sobre el machine learning, el Go… y lo que viene después

La reciente victoria de AlphaGo, el modelo de machine learning creado por Google para jugar al Go, frente a Lee Sedol, el mejor jugador del mundo, por 4 partidas a 1 (en la imagen, el tablero al final de la cuarta partida, la única que ganó el jugador …

Enrique Dans

etiqueta: reinforcement learning

Deepseek y la paradoja de Jevons

Entendiendo AlphaGo Zero

Algunas reflexiones sobre el machine learning, el Go… y lo que viene después