Deconstruyendo Babel

ImagenInteresantísimo y largo artículo en Wired, «Me translate pretty one day«, acerca de un tema que me obsesiona, la «deconstrucción de la torre de Babel» o traducción automática. El protagonista es Jaime Carbonell, un uruguayo formado en el MIT y Director Científico de Meaningful Machines, una empresa que afirma estar consiguiendo traducciones con un nivel de fidelidad muy prometedor a través de la acumulación masiva de textos obtenidos de Internet en multitud de idiomas, y de algoritmos capaces de separar frases en las llamadas «Language Meaning Units», o «LMUs», que son registradas e introducidas en una base de datos enorme y en permanente crecimiento. La empresa ya ha sido objeto de atención mediática en otras ocasiones, y plantea una de las rutas que siempre me han parecido más prometedoras, la de utilizar las inmensas cantidades de texto disponibles en la red para alimentar el aprendizaje de las máquinas. La otra ruta que me parece interesante es la de la personalización, en línea con eso que suelo comentar cuando tengo a alguien de Google al otro lado de la mesa: con todo lo que Google puede saber de mí y de mi uso del lenguaje, ¿por qué no es capaz de darme una traducción mejor que esa espantosa y estandarizada que sale del Google Language Tools? Está claro que los avances en este área están siendo y van a ser espectaculares.

10 comentarios

  • #001
    Francisco Javier Cantais - 1 diciembre 2006 - 12:32

    Yo veo un problema, y es que muchas de las páginas que se cojan como fuente serán producto de traductores automáticos de los malos de toda la vida. Es decir, si el sistema se encuentra con una serie de webs en las que, por ejemplo, «round trip» (viaje de ida y vuelta) se ha traducido como «viaje redondo», inferirá que esa es la traducción correcta.

  • #002
    David - 1 diciembre 2006 - 12:50

    La idea está muy bien. Yo utilizo Google con frecuencia para ayudarme en traducciones al inglés. Introduzco la frase de la que tengo dudas escrita en inglés para ver si aparece escrita así con el sentido que yo quiero. Hacer eso de manera automatizada tiene sentido.

  • #003
    J.Úbeda - 1 diciembre 2006 - 14:15

    El gran problema es y será durante mucho tiempo la incapacidad de los sistemas de inteligencia artificial para emular la intencionalidad del lenguaje. En otras palabras: el texto, es inseparable del contexto. La ironía, el sarcasmo, la complicidad, o el conocimiento común que un autor presupone a una determinada audiencia, hoy por hoy, escapan al control de las máquinas. Traducir implica leer, y no se puede leer sin interpretar.
    Claro que siempre hay alternativas, como esta comunidad creada recientemente, y que tiene una pinta estupenda.

    Un saludo.

  • #004
    Carme - 1 diciembre 2006 - 22:22

    Pues hasta que se consiga mejorar, de momento, con las herramientas que hay, lo mejor que he encontrado es esta extensión de Firefox.
    Un saludo.

  • #005
    Felipe Alfaro Solana - 1 diciembre 2006 - 22:41

    Lo siento Enrique, pero no cuela ;-)

    «Deconstrucción» es una palabra que no está admimitida por la Real Academia de la Lengua Española, pero en su lugar puedes utilizar «demolición» o «destrucción».

  • #006
    Gorki - 1 diciembre 2006 - 23:57

    No es lo mismo demoler o destruir que desconstruir (por mal que suene), una cosa es destrozar y ronmper y otra es desarmar pieza a pieza y creo que lo que cuenta Enrique, se aproxima más a lo contrario de construir.

    Había un proyecto muy bonito, que no sé en lo que habra quedado, o si se ha abandonado. Era imitar la lógica china que tranformar el lenguaje en ideogramas, pues la escritura china se entiende por cualquiera que sepa leer ideogramas, independientemente de la lengua de quien lo escribe o de quien lo lee, la escritura es el nexo de unión de la población china que hablan distintas lenguas, como el manchú, o el mandarín, y hablando pueden no entenderse, pero escribiendo una nota se entienden perfecxtamente todos.

    Si supieramos leer ideogramas un vasco leeria un periodico chino en vasco y un castellano en castellano
    directamente sin traducir del manchú.

    Consistía en encontrar un mecanismo para trasladar un texto a «ideogramas digitales» y la inversa, traducir los ideogramas digitales a las distintas lenguas,de forma que un texto con un solo proceso,se transformaba en una «escritura en ideogramas digitales» que podía ser traducido a todas las lenguas.

  • #007
    jose luis portela - 2 diciembre 2006 - 13:37

    Hola

    Yo soy el director de operaciones para el SUR de Europa de una empresa de distribucion muy grande que distribuye productos tecnológicos y unos de nuestros principales problemas es el tema de la traduccion de los manuales tanto de uso como tecnicos. Creo sin duda que esto nos puede ayudar muchisimo

  • #008
    Carlos - 2 diciembre 2006 - 18:41

    Las variables expresivas de la lengua son casi infinitas pero los ordenadores pueden abarcar también el infinito. Yo creo que la traducción perfecta llegará.

  • #009
    Iñigo - 3 diciembre 2006 - 17:36

    Este es un tema que me resulta fascinante, porque cuando llegue la traducción automática, la de verdad, cambiará el mundo.

    No es una pieza más de infraestructura digital. Multiplicará Internet porque eliminará la más importante barrera para el intercambio cultural. Google buscará indistintamente en todos los idiomas, leeremos el diario de Beijing y Skype (con ayuda del reconocimiento de voz) me permitirá hablar con añguien de Nepal. Mi PDA se convierte en el pez de babel. Para los que opinan que sufrimos sobredosis de información, no veas el atracón que nos vamos a dar.

  • #010
    Antonio Saz - 4 diciembre 2006 - 03:27

    Otros más redescrubriendo la rueda. Esto ya lleva más de treinta años en funcionamiento en el principal generador de documentación multilingüe del mundo: La Comisión Europea.

Dejar un Comentario

Los comentarios están cerrados