El Blog de Enrique Dans

Deconstruyendo Babel

Escrito a las 12:28 pm
11

ImagenInteresantísimo y largo artículo en Wired, Me translate pretty one day, acerca de un tema que me obsesiona, la “deconstrucción de la torre de Babel” o traducción automática. El protagonista es Jaime Carbonell, un uruguayo formado en el MIT y Director Científico de Meaningful Machines, una empresa que afirma estar consiguiendo traducciones con un nivel de fidelidad muy prometedor a través de la acumulación masiva de textos obtenidos de Internet en multitud de idiomas, y de algoritmos capaces de separar frases en las llamadas “Language Meaning Units”, o “LMUs”, que son registradas e introducidas en una base de datos enorme y en permanente crecimiento. La empresa ya ha sido objeto de atención mediática en otras ocasiones, y plantea una de las rutas que siempre me han parecido más prometedoras, la de utilizar las inmensas cantidades de texto disponibles en la red para alimentar el aprendizaje de las máquinas. La otra ruta que me parece interesante es la de la personalización, en línea con eso que suelo comentar cuando tengo a alguien de Google al otro lado de la mesa: con todo lo que Google puede saber de mí y de mi uso del lenguaje, ¿por qué no es capaz de darme una traducción mejor que esa espantosa y estandarizada que sale del Google Language Tools? Está claro que los avances en este área están siendo y van a ser espectaculares.

Publicidad

1 trackbacks

001

[...] No, no hablo todos los idiomas del mundo, al menos de momento no… Una utopia que quizás hoy esta un poquito más cerca, y es que a quien no le gustaría hablar todos los idiomas del mundo, poder comunicarse sin limitaciones con cualquier person… [...]

10 comentarios

001
Francisco Javier Cantais
01.12.2006 a las 12:32 Permalink

Yo veo un problema, y es que muchas de las páginas que se cojan como fuente serán producto de traductores automáticos de los malos de toda la vida. Es decir, si el sistema se encuentra con una serie de webs en las que, por ejemplo, “round trip” (viaje de ida y vuelta) se ha traducido como “viaje redondo”, inferirá que esa es la traducción correcta.

002
David
01.12.2006 a las 12:50 Permalink

La idea está muy bien. Yo utilizo Google con frecuencia para ayudarme en traducciones al inglés. Introduzco la frase de la que tengo dudas escrita en inglés para ver si aparece escrita así con el sentido que yo quiero. Hacer eso de manera automatizada tiene sentido.

003
J.Úbeda
01.12.2006 a las 14:15 Permalink

El gran problema es y será durante mucho tiempo la incapacidad de los sistemas de inteligencia artificial para emular la intencionalidad del lenguaje. En otras palabras: el texto, es inseparable del contexto. La ironía, el sarcasmo, la complicidad, o el conocimiento común que un autor presupone a una determinada audiencia, hoy por hoy, escapan al control de las máquinas. Traducir implica leer, y no se puede leer sin interpretar.
Claro que siempre hay alternativas, como esta comunidad creada recientemente, y que tiene una pinta estupenda.

Un saludo.

004
Carme
01.12.2006 a las 22:22 Permalink

Pues hasta que se consiga mejorar, de momento, con las herramientas que hay, lo mejor que he encontrado es esta extensión de Firefox.
Un saludo.

005
Felipe Alfaro Solana
01.12.2006 a las 22:41 Permalink

Lo siento Enrique, pero no cuela ;-)

“Deconstrucción” es una palabra que no está admimitida por la Real Academia de la Lengua Española, pero en su lugar puedes utilizar “demolición” o “destrucción”.

006
Gorki
01.12.2006 a las 23:57 Permalink

No es lo mismo demoler o destruir que desconstruir (por mal que suene), una cosa es destrozar y ronmper y otra es desarmar pieza a pieza y creo que lo que cuenta Enrique, se aproxima más a lo contrario de construir.

Había un proyecto muy bonito, que no sé en lo que habra quedado, o si se ha abandonado. Era imitar la lógica china que tranformar el lenguaje en ideogramas, pues la escritura china se entiende por cualquiera que sepa leer ideogramas, independientemente de la lengua de quien lo escribe o de quien lo lee, la escritura es el nexo de unión de la población china que hablan distintas lenguas, como el manchú, o el mandarín, y hablando pueden no entenderse, pero escribiendo una nota se entienden perfecxtamente todos.

Si supieramos leer ideogramas un vasco leeria un periodico chino en vasco y un castellano en castellano
directamente sin traducir del manchú.

Consistía en encontrar un mecanismo para trasladar un texto a “ideogramas digitales” y la inversa, traducir los ideogramas digitales a las distintas lenguas,de forma que un texto con un solo proceso,se transformaba en una “escritura en ideogramas digitales” que podía ser traducido a todas las lenguas.

007
jose luis portela
02.12.2006 a las 13:37 Permalink

Hola

Yo soy el director de operaciones para el SUR de Europa de una empresa de distribucion muy grande que distribuye productos tecnológicos y unos de nuestros principales problemas es el tema de la traduccion de los manuales tanto de uso como tecnicos. Creo sin duda que esto nos puede ayudar muchisimo

008
Carlos
02.12.2006 a las 18:41 Permalink

Las variables expresivas de la lengua son casi infinitas pero los ordenadores pueden abarcar también el infinito. Yo creo que la traducción perfecta llegará.

009
Iñigo
03.12.2006 a las 17:36 Permalink

Este es un tema que me resulta fascinante, porque cuando llegue la traducción automática, la de verdad, cambiará el mundo.

No es una pieza más de infraestructura digital. Multiplicará Internet porque eliminará la más importante barrera para el intercambio cultural. Google buscará indistintamente en todos los idiomas, leeremos el diario de Beijing y Skype (con ayuda del reconocimiento de voz) me permitirá hablar con añguien de Nepal. Mi PDA se convierte en el pez de babel. Para los que opinan que sufrimos sobredosis de información, no veas el atracón que nos vamos a dar.

010
Antonio Saz
04.12.2006 a las 03:27 Permalink

Otros más redescrubriendo la rueda. Esto ya lleva más de treinta años en funcionamiento en el principal generador de documentación multilingüe del mundo: La Comisión Europea.

Dejar un comentario

Los comentarios en esta página están moderados, no aparecerán inmediatamente en la página al ser enviados. Evita, por favor, las descalificaciones personales, los comentarios maleducados, los ataques directos o ridiculizaciones personales, o los calificativos insultantes de cualquier tipo, sean dirigidos al autor de la página o a cualquier otro comentarista. Estás en tu perfecto derecho de comentar anónimamente, pero por favor, no utilices el anonimato para decirles a las personas cosas que no les dirías en caso de tenerlas delante. Intenta mantener un ambiente agradable en el que las personas puedan comentar sin temor a sentirse insultados o descalificados. No comentes de manera repetitiva sobre un mismo tema, y mucho menos con varias identidades (astroturfing) o suplantando a otros comentaristas. Los comentarios que incumplan esas normas básicas serán eliminados.

XHTML: Puedes utilizar estas etiquetas: A ABBR ACRONYM B BLOCKQUOTE CITE CODE DEL EM I Q STRIKE STRONG IMG

Logotipo de Blogestudio Logotipo de Acens