Me ha resultado muy interesante la lectura de este estudio llevado a cabo por la compañía polaca Tidio sobre las alucinaciones de los algoritmos, titulado «When machines dream: a dive in AI hallucinations« (pdf), en el que se define de manera bastante adecuada y se tipifica el fenómeno, además de añadir una cierta investigación sobre las reacciones de los usuarios.

El fenómeno de la alucinación de los algoritmos es bien conocido desde hace ya mucho tiempo, y se debe únicamente a problemas derivados de la estadística, similares a los que tienen lugar, a una escala completamente diferente, al de la multicolinearidad que surge cuando se trabaja con variables con elevados niveles de superposición. Ese mismo tipo de efectos, cuando elevamos de manera absolutamente brutal el número de variables hasta los miles de millones y, por tanto, la posibilidad de aparición de correlaciones de todo tipo, hacen que, en muchas ocasiones, los algoritmos nos devuelvan respuestas que pueden ir desde lo completamente falso o incluso lo difamatorio cuando se trata de personas, hasta cosas divertidas o que parecen directamente sacadas de un mal viaje con LSD.

Me parece preocupante el número de personas, un 22%, que se apuntan a creer que estamos hablando de respuestas generadas por algún tipo de gobierno o entidad que pretende, supuestamente, divulgar una agenda determinada. Ver las alucinaciones de los algoritmos como algo así implica, aparte de una fortísima inclinación a la conspiranoia más absurda e insostenible, la evidencia de no tener ni maldita idea de estadística básica.

La única forma de luchar contra el problema potencial que supone la incidencia de alucinaciones en algoritmos generativos, aparte de trabajar en la mejora de sus prestaciones para ser capaces de detectarla, es la educación. Que un algoritmo alucine y nos devuelva una respuesta absurda deja de ser un problema cuando dejamos de interpretar al algoritmo como algún tipo de «inteligencia superior» o «referencia» y lo entendemos como lo que realmente es: un artefacto estadístico que busca y examina correlaciones, y que cuando no encuentra una muy convincente, trata de encontrar otra que lo parezca. Por tanto, la tarea de comprobar las respuestas, de desconfiar de los resultados obtenidos y de no tomar nada como seguro hasta que hayamos podido verificarlo adecuadamente resulta fundamental.

Que cuando empezamos a utilizar algoritmos generativos se nos pueda escapar una alucinación como si fuera una respuesta real puede ser algo que entra dentro de lo posible: usuario inexperto, algoritmo sorprendente y casi «mágico»… toda tecnología suficientemente avanzada es, como bien decía Arthur C. Clarke, indistinguible de la magia. Que nos siga pasando tras un proceso de educación en el uso adecuado de algoritmos generativos es ya un problema diferente, que tiene más que ver con la vagancia o la inconsciencia propia de quien no ha aprovechado esa instrucción.

Es una de las razones por las cuales introducir una tecnología como los algoritmos generativos en la educación resulta fundamental. Debemos evitar lo que ocurrió con internet, que a fuerza de ignorarlo y hasta prohibirlo en los colegios, terminó siendo algo que los jóvenes se contaban unos a otros, lo que redundó en una ignorancia absoluta de sus peligros y de sus posibilidades. Los supuestos «nativos digitales» terminaron siendo «huérfanos digitales» a los que nadie se había preocupado por dotar de una educación en el uso de una tecnología verdaderamente potente. Si nos ocurre lo mismo con los algoritmos generativos, estaremos de nuevo repitiendo el mismo error, y fallando a la hora de preparar a la sociedad para el uso de una herramienta potencialmente muy buena.

Si eres profesor y no estás planteándote ya cómo introducir los algoritmos generativos en tu materia, hay algo que no estás haciendo bien. Pero claro, años de ignorancia, de conservadurismo y de prohibiciones absurdas de dispositivos en muchos entornos educativos no nos lo han puesto nada fácil…