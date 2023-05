Hace ya unos cuantos años que, en la primera sesión de mis cursos y en muchas de mis conferencias, empecé a introducir ejemplos de síntesis de voz de muchos tipos: desde voces sintetizadas que sonaban completamente humanas, hasta deepfakes míos o de personajes famosos, pasando por muchos otros ejemplos. Me parecía una forma interesante de mostrar hasta qué punto la tecnología adquiría nuevas funcionalidades, y cómo la regulación de su uso podía entrañar numerosas dificultades.

Hasta ahora, crear una voz de unas características determinadas o que sonase exactamente igual que la tuya o la de otra persona era una tarea que, aunque resultaba relativamente sencilla y se limitaba a leer unas cuantas frases ante un micrófono (aunque había ya métodos para poder clonar una voz con pocos segundos de casi cualquier locución), los usuarios normales no solían llevar a cabo, y de ahí que resultase relativamente sorprendente.

Ahora, Apple acaba de lanzar una actualización de sus funcionalidades de accesibilidad, y una de ellas es precisamente la de crear una copia de nuestra propia voz, pensada en principio para afectados por la esclerosis lateral amiotrófica y enfermedades similares que conllevan la pérdida del habla, pero que sin duda será utilizada por muchos que no las padezcan: un proceso sencillo y relativamente rápido (15 minutos) que permite, tras leer unas cuantas frases para adiestrar al algoritmo, contar con un asistente que reproduce los textos que le tecleemos con nuestra propia voz, o que reproduzca frases que empleamos habitualmente.

Crear un voice bank con tu voz es una posibilidad que, hasta ahora, el común de los usuarios no podía hacer. Era algo relativamente especializado, que de hecho muchos pacientes de ELA en fases incipientes iban posponiendo hasta que, un día, se encontraban con que su dolencia había alcanzado un nivel en el que era ya demasiado tarde para llevarlo a cabo, precisamente cuando más empezaban a echar de menos su capacidad de hablar. Ahora, ya tenemos en un simple iPhone una prestación, cuyo uso está diseñado para esas personas que, debido a diversas dolencias, pierden físicamente la capacidad de hablar, pero que estoy completamente seguro de que surgirán muchos otros usos para ello, tanto buenos como no tan buenos.

La velocidad de la innovación es cada vez más apabullante. El tiempo que transcurre entre la aparición de una funcionalidad determinada que puedes mostrar a una audiencia y lograr un cierto efecto sorpresa (muy útil en términos académicos, porque generan en las personas anchors de memoria extremadamente útiles) y la normalización total de esa funcionalidad, hasta el punto de que cualquiera puede ponerla en práctica o incluso haberla utilizado antes de que se lo cuentes, es cada vez más corto. Cuando empecé a dar clase de tecnología e innovación, el decano de entonces – hace ya más de tres décadas – pretendía que las clases de los profesores de mi área, dado que tenían lugar en aulas con la mitad de capacidad y, por tanto, había que duplicarlas, se pagasen a la mitad (afortunadamente, su propuesta no se llegó a llevar a cabo). Ahora, dada la necesidad de actualización de los contenidos de los cursos que imparte mi área con respecto a otras más «tradicionales», habría que pagarlas al doble :-)

This article is also available in English on my Medium page, «Apple’s Personal Voice speaks volumes about the pace of technological change: nobody’s surprised by anything anymore»