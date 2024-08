Mi columna de esta semana en Invertia se titula «Racionalizando la sustitución de personas por máquinas» (pdf), y es un intento de entender el fenómeno de la sustitución de trabajadores humanos por máquinas, a raíz de la nueva convocatoria de la huelga del sindicato SAG-AFTRA contra la industria de los videojuegos derivada del fracaso de las negociaciones para la protección de los trabajadores contra la inteligencia artificial.

Que el desarrollo de la tecnología deje a una persona sin trabajo genera una frustración que cualquiera que tenga un trabajo y un mínimo de empatía puede entender. Que los trabajadores afectados vayan a la huelga para intentar reclamar protecciones o compensaciones de algún tipo también. Sin embargo, me parece interesante reflexionar sobre la sostenibilidad de esas acciones en un mundo en el que la tecnología marca el camino y señala a los ganadores que aprenden a utilizarla adecuadamente, frente a los que simplemente la ignoran.

Un puesto de trabajo existe mientras a alguien le interesa que sea desempeñado por una persona. Si el producto de ese trabajo puede ser desempeñado de manera ventajosa y con menos costes por una máquina, lo razonable parece que sea sustituido. ¿Es este el caso de la locución de videojuegos? Los actores, en sus pancartas, reclaman que «keep video games people powered«, en un muy logrado doble sentido que implica que hagamos que los videojuegos sigan siendo hechos por personas y que mantengamos la energía de las personas que hacen los videojuegos, pero… ¿tiene esa petición sentido? ¿Puede llevarse a cabo?

La industria de los videojuegos es muy interesante. Además de los grandes estudios por todos conocidos, existen muchísimos competidores pequeños, cuya viabilidad depende de que el producto que desarrollan, muchas veces un único proyecto, sea aceptado por el público, se viralice o, por la razón que sea, alcance un éxito de ventas. Por otro lado, la locución es una parte necesaria de la mayoría de los videojuegos, pero generalmente no su componente principal ni más relevante, y quienes la llevan a cabo, actores de doblaje, tienen un trabajo difícil, que conlleva horas y horas de locución en un estudio. Si das voz a un personaje de un videojuego exitoso del cual se llevan a cabo sucesivas ediciones, has tenido mucha suerte, pero también te puede ocurrir que el estudio escoja pagar a un actor de la gran pantalla o la televisión para que incorpore la voz del personaje, o que el videojuego no funcione en el mercado y no te genere más trabajo.

En medio de todas esas incertidumbres, surge una tecnología capaz de generar voces a partir de un entrenamiento. Los estudios comienzan a entrenar a esa tecnología con las propias voces de los actores con los que trabajaban, algo que, lógicamente, debería generar una compensación mayor que una sesión de doblaje de las habituales, dado que está encaminada a sustituir al actor que participa en ella. Pero una vez completado el entrenamiento, el algoritmo es capaz no solo de generar las locuciones necesarias para el desarrollo de la trama del videojuego, sino que incluso puede convertirse en un generador coyuntural, para otras posibles situaciones del juego que incluso podrían generarse sobre la marcha, en función de determinados comportamientos del jugador, y que ya no sería preciso locutar y grabar en absoluto.

La tecnología genera, en este caso, grados de libertad adicionales a la creatividad de los diseñadores del videojuego. Pero además, da lugar a un ahorro de costes notable, al no tener que demandar horas del locutor. Lógicamente, si el algoritmo ha sido entrenado con una voz determinada, podría plantearse que generase derechos de autor para ese actor o actriz, pero de esa situación, seguramente planteable para personas con voces muy características o consolidadas, podemos pasar a otra en la que la tecnología, simplemente, genera una voz a partir de una descripción determinada, que ya no corresponde a ninguna persona real. A partir de ahí, la voz de un personaje de videojuego podría, simplemente, dejar de corresponderse con las grabaciones de un actor o actriz, y pasar a ser simplemente algo que una máquina genera a demanda.

¿Tiene sentido, en ese escenario tecnológico, que los actores pretendan proteger sus puestos de trabajo? Si un estudio se plantea seguir manteniendo a actores reales como generadores de las voces de los personajes de sus videojuegos, tendrá una libertad creativa posiblemente menor, unos costes más elevados y unas limitaciones mayores que las de los estudios que no lo hagan, lo que podría terminar implicando una competitividad menor (aunque en este caso, el componente del doblaje de los personajes sobre el total de los costes de desarrollo de un videojuego sea, por lo general, relativamente pequeño).

¿No deberíamos plantearnos si, en ese entorno definido por la disponibilidad de una tecnología determinada, tiene sentido que, en el futuro, sigan siendo los actores los que graben las voces de los personajes de los videojuegos? Y si la respuesta es negativa, habrá que plantear medidas que protejan temporalmente a las personas que pierden su trabajo – arbitrando, por ejemplo, pagos más elevados para las sesiones de entrenamiento del algoritmo – pero no plantear que la cuestión siga yendo mucho más allá: simplemente, aceptar que eres «de los últimos de tu especie».

¿Es esa la lógica? ¿Qué debe plantearse alguie con los conocimientos suficientes de su profesión y de tecnología como para entender que el futuro es, muy probablemente, ese? Básicamente, tratar de que cuando esa situación ocurra, tu papel esté en el lado de los que generan esa tecnología y dan lugar a la disrupción, no en el de aquellos que la sufren. Algo, obviamente, no al alcance de cualquiera y que resulta más fácil decir que hacer. Pero que implica, por otro lado, una aceptación de que las cosas, como hemos visto en innumerables ocasiones a lo largo de la historia, evolucionan y cambian con la tecnología, y que tratar de oponerse a ello es, simplemente, un enfoque inadecuado del problema.