La cámara y el software

IMAGE: Skype

Skype anuncia una funcionalidad que permite al usuario desenfocar el fondo de la imagen que está transmitiendo a través de la cámara de su ordenador o de su smartphone, manteniendo el enfoque correcto en la imagen de su persona en forma de elegante efecto bokeh, lo que posibilita en cierta medida que nos despreocupemos de lo que tenemos en el fondo y de la molestia de tener que estar preocupado sobre lo que aparece o deja de aparecer. El algoritmo es capaz de identificar nuestra cara, pelo y brazos, delimitar nuestra imagen a partir de ahí, y desenfocar el resto de la imagen para evitar que la atención se pueda centrar en otros elementos.

La prestación me lleva a plantearme hasta qué punto está avanzando la capacidad de desarrollo de algoritmos capaces de reconocer partes de una imagen y de tratarlas de manera diferencial en función del interés de cada caso: para una cámara que simplemente recoge píxeles, la posibilidad de entender que determinados píxeles son una persona, que esa persona está intentando mantener una conversación, y que lo que hay en el fondo es irrelevante y puede o debe por tanto desenfocarse a petición del usuario es algo sobre lo que conviene reflexionar, y que ya comenté anteriormente cuando Apple puso en el mercado el iPhone 8 con el conocido como Portrait mode, capaz de aplicar efectos de iluminación y de mejorar las fotos en función de determinadas circunstancias.

Las mejoras aplicadas por Google a la cámara de su Pixel 3 generaron también análisis similares: hasta qué punto lo importante en una cámara es la calidad de su óptica – lógicamente, superados unos niveles de terminados – o los algoritmos que permiten aplicar mejoras o correcciones a la imagen que tiene delante. En términos de machine learning, la idea de generar esos algoritmos de tratamiento de imágenes es algo que ya ha sido sensiblemente optimizado para casos generalistas como estos en los que se pretende es satisfacer necesidades habituales como mejorar la iluminación o quitar importancia a un fondo, y sin duda veremos muchos más casos aplicados a otras necesidades más específicas a medida que avance el tiempo.

La reflexión resulta interesante cuando pensamos en las capacidades necesarias para mantener el liderazgo en una industria: desde hace ya tiempo, la industria de la fotografía se ve en la necesidad de desarrollar toda una serie de habilidades de software en lugar de centrarse en lo que era su negocio tradicional, la capacidad de desarrollar ópticas o mecanismos básicamente de hardware, con la dificultad que supone no solo aventurarse en un segmento diferente en el que el desarrollo de expertise responde a otros parámetros completamente diferentes, y con lo que puede llegar a suponer ser competitivo o ser capaz de atraer talento en esas áreas.

Cada día más, debemos reconceptualizar nuestros productos en varias dimensiones: por un lado, pensando cuántas de las variables del proceso de compra o de las dinámicas competitivas responderán al producto como tal frente a la posibilidad de vincularlo a un servicio de algún tipo que pueda convertirse en diferencial, como estamos viendo en el caso de Apple y su progresiva orientación a servicios (no te vendo un smartwatch, sino que si me lo compras, podrás tener acceso a un servicio permanente de monitorización que te previene en caso de arritmias, caídas o problemas de otros tipos). Por otro lado, qué partes de ese producto van a diferenciarse mediante mejoras generalmente incrementales en los componentes físicos del mismo, y cuáles van a hacerlo gracias a la incorporación de software con unas capacidades determinadas.

Si eres responsable de algún tipo de producto físico, empieza a planteártelo: el mundo se ha vuelto mucho más complejo en ese sentido, y la capacidad de diferenciarlo no va a seguir dependiendo siempre de los mismos factores.


This post is also available in English in my Medium page, “What Skype’s blur feature tells us about maintaining leadership in your sector


7 comentarios

  • #001
    Ivan - 7 febrero 2019 - 14:28

    Entiendo que es la función heredada que ya existe en Microsoft Teams y un paso más a al confluencia

    • Enrique Dans - 7 febrero 2019 - 14:33

      Sí, es la misma función pero extendida a la base de usuarios de Skype.

    • Mezo - 10 febrero 2019 - 03:08

      Team tiene esa función desde 2017, pero ahoran lo presentan como si fuera revolucionario.

  • #004
    Mortadelo 6 - 7 febrero 2019 - 15:22

    Con lo cursi que queda llamarle bokeh, y algún guarr@ denomina “never clean your room again”, y yo pensando que te podían captar en tu biblioteca “La rama dorada” como hace el director de “Apocalypse Now”.

    No señorito, no, no te dan un servicio “reconceptual” (mire la RAE), te venden un relojete para que te lo metas en el brazalete, y te diga lo mismo que el del Lidl, pero multiplicando su “valor añadido” por veinte

    Muy bueno este párrafo: (ironia on)

    “Si eres responsable de algún tipo de producto físico, empieza a planteártelo: el mundo se ha vuelto mucho más complejo en ese sentido, y la capacidad de diferenciarlo no va a seguir dependiendo siempre de los mismos factores.”

    ¿Me puede citar productos no físicos?.
    Un galego reconceptual diría, mmmm el SW.
    Si es que de donde no hay,… no se pueden sacar productos no físicos. El eterno dilema entre alma y cuerpo…. ironia off

    Por cierto, No se ha planteado el caso contrario, que de una imagen desenfocada se obtenga una imagen nítida. Eso si que es más complicado, algorítmicamente hablando, o lo de obtener fotos de objetos escondidios a partir de reflejos de luz en la pared, y ambas cosas se hacen… pero hasta lo que sés imposible en tiempo real… lo facil es quitar y no poner, es como lo de escribir un blog o criticar un artículo.

    • Gorki - 7 febrero 2019 - 22:00

      Productos no físicos, la música, la sabiduría, los idiomas, el humor, la justicia, …

  • #006
    Josu - 9 febrero 2019 - 11:28

    Muy interesante esta reflexión, que creo aplicable no solo a productos físicos, sino a todo producto o servicio susceptible de ser reorientado gracias a la tecnología. El añadido sobre lo que está pasando en el mundo de la fotografía es además un gran ejemplo para entender lo que es transformar digitalmente un producto o servicio y no quedarse en la mera digitalización. Gracias por la aportación!

  • #007
    Gonzalo - 15 febrero 2019 - 15:13

    Si esto lo hubiesen hecho en el Messenger de MSN habrían ahorrado muchos problemas de privacidad, pero nunca es tarde.

Dejar un Comentario a Gorki

Los comentarios están cerrados