Subtítulos y sincronización automáticos en YouTube

Google AccessibilityUna de esas nuevas prestaciones presentadas por Google que me llaman especialmente la atención: YouTube Automatic Captions permite, utilizando tecnología de reconocimiento del habla, insertar subtítulos generados automáticamente a partir del sonido de un vídeo. Lógicamente, no son perfectos, pero pueden servir de guía aproximada para personas con problemas de audición o para quienes no dominan el idioma del vídeo. Además, los subtítulos pueden insertarse directamente traducidos a otros idiomas, lo que convierte en accesibles una gran cantidad de vídeos del inmenso repositorio de la herramienta.

La otra herramienta, YouTube Automatic Timing, permite subir un archivo de subtítulos en un vídeo, y que la herramienta inserte, también utilizando tecnología de reconocimiento del habla, cada frase en su lugar correspondiente, evitando tener que hacerlo manualmente.

Las dos tecnologías aparecen presentadas en este vídeo. La reconstrucción de la torre de Babel, un poquito más cerca, y como bien han visto en los primeros comentarios a la entrada, no solo para las personas: las dos tecnologías permiten, por un lado, hacer accesible a los anunciantes la contextualización de sus anuncios al texto de los vídeos y, por otro, la ubicación de dichos anuncios en los momentos adecuados, cuando una palabra determinada es mencionada en los mismos. El vídeo es un formato de contenido que está cambiando la fisionomía de la red, y su principal exponente, YouTube, es una empresa que, de acuerdo con uno de sus principales inversores históricos, podría haber alcanzado ya la rentabilidad.

14 comentarios

  • #001
    tienesunemilio - 22 noviembre 2009 - 21:45

    Y de aquí, a incluir la posibilidad de hacer búsquedas sobre videos por palabras incluidas en su contenido hay un paso…

  • #002
    Xavier - 22 noviembre 2009 - 22:02

    Los anuncios contextualizados en Youtube a la vuelta de la esquina…

  • #003
    Enrique Dans - 22 noviembre 2009 - 22:13

    #1 y #2: muy buen punto, lo incorporo a la entrada.

  • #004
    SHATO - 22 noviembre 2009 - 23:17

    #2: Hay que monetizar el producto… llegará el día que en un vídeo, cuando se diga «refresco» o «tengo sed», aparezca el anuncio de alguna de las marcas más conocidas. El proceso creativo que siguió Google para conseguir ingresos para sí, vuelve a dar sus frutos.

  • #005
    Dubitador - 22 noviembre 2009 - 23:35

    Cuando tuviste el brazo derecho chungo, creo que sugeri que en vez de darle al teclado con la mano izquierda probaras algun hable-escribe: programa que traduce la voz a texto.

    El subtitulado automatico de los tubes tiene que indicar que se han producido avances significativos en la conversion de voz a texto.

    Quizas el recurso a un laringofono incremente la tasa de acierto e incluso reduzca los problemas derivados de la distorsion por ruido ambiental, interferencias emocionales, ronquera u obturacion de las vias respiratorias por acatarramiento.

    Supuesto que se hayan dado tales avances decisivos, cabe esperar que el escribir en un movil, via un laringofono capaz de capturar las minimas vibraciones derivadas de la intravocalizacion en silencio resulte mucho mas practico y discreto o incluso devenga en la forma mas popular de escribir. Entre el teclado y el laringofono, la escritura manuscrita va a quedar para los carrozas.

    La subtitulacion de los tubes tiene un alcance que va mas allá del servicio que pueda prestar a sordos y desconocedores del idioma, ya que permite marcar, asociar y recuperar la informacion con mucha mayor precision y detalle. Ademas al ser tambien automatica la sincronizacion de los subtitulos se añade un aliciente para el eventual traductor ya que podra centrarse en pulir el texto .

  • #006
    Gorki - 22 noviembre 2009 - 23:55

    Mi opinión que tras lo que anda Google conseguir la traducción automática on-line, bien entre un contenido, sea texto o vídeo y el usuario, o entre entre dos usuarios de distinta lengua..

    Manejo con cierta frecuencia el traductor de Google, sin ser aun perfecto, la calidad que ha alcanzado en los últimos tiempos es espectacular, De forma que ya la traducción es absolutamente que devuelve es muy comprensible y diría que correcta en más de un 855 de las frases, Esto que presentan hoy, me parece un paso más en la misma dirección.

    Piensen lo que sería poder leer un libro de arquitectura en polaco, o ver una película de Bolywood traducida automáticamente a tu idiomaa. Piensen lo que sería una videoconferencia, entre un español y un coreano, cada uno hablando en su lengua y enviándose documentos, en su idioma y que los dos se entendieran sin problemas.

    Pues bueno, ese inmenso mercado, lo tiene Google para el solo, pues en este momento, ha sacado tal distancia a los demás sistemas traductores, que no existe enemigo, no es que dea lider, es que esta absolutamente solo, no es un monopolio, es que no existe la competencia.

    Dicen que el perfeccionamiento de la traducción, la ha conseguido comparando los mismos títulos de libros traducidos a en diferentes idiomas, de forma que hoy no tiene un diccionario de palabras, sino de frases completas.

    También he leído por ahí, que sul motor de traducción traslada las frases del idioma a un «esperanto digital» basado en el sistema oriental de transformar frases en ideogramas y pasar esos ideogramas a cualquier idioma, de forma que estableciendo la correlación entre un nuevo idioma con los «ideogramas digitales» y viceversa, estomáticamente queda conectado con todos los demás idiomas que ya lo estén. ..

  • #007
    Shato - 23 noviembre 2009 - 05:41

    Estoy empezando a coger vértigo con lo que este avance puede traer consigo. ¿Será el precursor de el «Traductor Universal» de StarTrek?

  • #008
    Viper - 23 noviembre 2009 - 09:18

    #7, lo que hoy es ciencia ficción, mañana es ciencia a secas…..

  • #009
    Cesar Martínez Bagüés - 23 noviembre 2009 - 09:24

    A alguien le suena la cifra 2012…El mundo no volvera a ser como es…nos lo habían advertido. Un montón de debates externos sin hacer caso de avances que en cualquier momento romperan los sistemas de sociedad actual. Luego todos a correr. No hace falta ser Julio Verne…tu me entiendes.

  • #010
    José Luis Antúnez - 23 noviembre 2009 - 10:04

    Continuando con el comentario #1 y #2 en el Techcrunch50 de este año se presentó AnyClip (vídeo demo) que permite la búsqueda de palabras en fragmentos de películas.

  • #011
    Andreu - 23 noviembre 2009 - 10:29

    Ya lo veíamos en la presentación del Google Wave: un chat bilingüe traducido ontime! Las posibilidades de una tecnología así, aplicada a texto, audio, vídeo… revolucionará el mundo de la comunicación internacional.

    Y cuando sea un implante cerebral, ya te cagarás… ;-)

  • #012
    Target Comunicacion - 23 noviembre 2009 - 11:58

    La búsqueda de palabras en fragmentos de videos abre todo un mundo de posibilidades a nivel de marketinh y publicidad, esperemos que se desarrolle mejor esta tecnología porque será un gran campo a explotar.

  • #013
    grupero - 23 noviembre 2009 - 13:03

    Si windows compra una empresa es monopolista. SI Google lo hace es que es un ‘apoyatalentos’
    ¿Ayudar a las personas que no oyen, acercar los contenidos a los discapacitados? ¿¿pero què dice ?? eso es eufemismo. Steve Ballmer se apersonó de Youtube para hacerlo rentable (lo cual no està mal) pero estos discursos pseudosociales son engañosos. Le estamos entregando el sentido del lenguaje y de la comunicaciòn a Google. En un futuro las cosas se llamaràn y significaràn como lo diga Google. Yo me aparto de estar compartièndoles toda mi info.

  • #014
    zahorin - 25 noviembre 2009 - 23:13

    Es muy interesante y he hecho una entrada en mi blog tratando de explicarlo con imágenes.
    De cualquier forma la calidad de las traducciones de Google dejan mucho que desear. No se acercan, ni de lejos a las traducciones del traductor gratuito online «Promt».
    De lo que estoy seguro es que al final conseguirán hacerlo bien y será un gran logro para las comunicaciones entre personas con idiomas diferentes.
    Será toda una revolución social, económica, educativa, etc.

Dejar un Comentario

Los comentarios están cerrados