Sensorización y machine learning

Las noticias del día dejan lugar a pocas dudas: nos dirigimos hacia un futuro en el que viviremos completamente rodeados de sensores de todo tipo. Los auriculares de la foto son el último desarrollo de SMS Audio, la empresa creada por el rapero 50 Cent, basados en tecnología de Intel, y pensados para monitorizar variables fisiológicas asociadas al ejercicio físico, un encaje que podría parecer bastante más natural para la práctica del deporte que llevar puesta una pulsera, una banda en el pecho o un reloj en la muñeca.

Pero los auriculares son solo una pequeñísima pieza en un rompecabezas enorme que está detrás de muchos de los recientes desarrollos y movimientos en el sector de la tecnología: ayer también se anunció la adquisición de SmartThings por parte de Samsung, doscientos millones de dólares que posicionan al gigante coreano en el mundo del home automation (iluminación, humedad, cerraduras… de todo) y que convierten en millonarios a los fundadores de una compañía iniciada en Kickstarter. Claramente, la tendencia es hacia que sensoricemos nuestros cuerpos, nuestro entorno, nuestros hogares y nuestros automóviles, aunque ello nos lleve a no tener nada claro de quién va a ser la responsabilidad cuando la información recogida por esos sensores desencadene una mala decisión.

Relojes inteligentes, brazaletes para la monitorización de personas mayores, nuevos desarrollos en baterías pensadas específicamente para ese tipo de dispositivos… y una auténtica riada de datos producidos cada vez que nos movemos, hacemos ejercicio, o simplemente respiramos. Datos de todo tipo, con posibilidades de utilización muy imaginativas o muy peligrosas, que van a determinar nuevas reglas de negocio que están poniendo en solfa incluso los acuerdos internacionales.

¿Qué hacemos con tantos datos generados por tantos sensores? Ya estamos saturados, y solo estamos analizando en torno al 1% de los datos generados. Lo lógico – o casi lo único – que podemos hacer es… poner a otras máquinas a analizarlos. El machine learning se está evidenciando como la gran frontera, como la única forma de lograr que semejante recolección constante de datos tenga un mínimo de sentido. El entrenamiento de un algoritmo con datos de 133.000 pacientes de cuatro hospitales de Chicago entre 2006 y 2011 logró un diagnóstico de situaciones de urgencia tales como problemas cardiovasculares o respiratorios, emitido con cuatro horas de adelanto sobre el realizado por los médicos. Una recopilación de parámetros de la historia clínica del paciente, combinados con información sobre su edad, antecedentes familiares, y determinadas analíticas, tras ser analizadas por un algoritmo, es susceptible de dar lugar a una drástica reducción de fallecimientos relacionados con este tipo de situaciones, en las que la provisión de asistencia médica unas horas antes puede resultar vital.

Sin duda, estamos viviendo un auge de la sensorización. Pero el paso siguiente, lógico o incluso imprescindible va a ser el desarrollo de herramientas para que la inmensa cantidad de datos generados por esos sensores puedan ser analizados con un mínimo de criterio. Un escenario muy interesante, con un potencial brutal, y en el que sin duda veremos pronto algunos movimientos importantes…

(This article is also available in English in my Medium page, “Sensorization and machine learning«)

#001
Antonio Castro - 15 agosto 2014 - 12:25
¿Si esos datos biométricos de una persona no puede hacerse públicos, porque una empresa puede recogerlos y gestionarlos con total opacidad?
Estamos acostumbrados a pulsar botones que dicen ‘Acepto’ sin leer siquiera lo que estamos aceptando porque nos basta saber que lo que nos pase a nosotros también le pasará a muchísima más gente para concluir que no puede ser muy malo.
Los primeros que asumen esa forma de actuar son los consumidores compulsivos de tecnología. El único precio que nos importa es el precio en dinero. Es un problema de miopía o de falta de perspectiva porque las consecuencias sociales de infravalorar el poder de la información las venimos pagando desde hace bastante y es algo que tiende a empeorar.
La falta de poder ciudadano tiene mucho que ver con el control de la información al que estamos siendo sometidos.
#002
Gorki - 15 agosto 2014 - 13:01
Precisamente estoy en este momento analizando el buscador de Google, ¿Que hace el buscador de Google? Analizar datos quer están a disposicio nde cualquiera y darlos un valor añadido, en este caso catalogarlos y ponderar su importancia, para mostrarlos al usuario que desee disfrutar de ese valor añadido y aprovechar ese tráfico de datos para sacar un beneficio.
Si generalizamos el concepto, es posible explorar cualquier tipo de registros s existente en la Big Data, por ejemplos datos generados por el Internet de las cosas, para añadirlos un valor añadido y entregarlos a quien los desee, obteniendo un beneficio de ese tráfico.
Con que solo consigamos un uno por mil de lo que ha conseguido Google, ya estamos hablando de un colosal negocio.
#003
Garepubaro - 15 agosto 2014 - 13:16
Pues cualquiera que haga deporte no usa estas cosas, pronto se entera uno que ya no hace los 10 km en media hora eso son los parametros que importa. A ver que explique uno que haga deporte todos los dias que utiliza estas cosas frecuentemente, no aparecera ni uno … hombre tambien tiene que existir la gente, las empresas, que recoja datos de uno y le interese salvarle la vida, unicamente sea porque al salvarle la vida sigue cobrando entonces eso es positivo, hay que entregar los datos por tanto, no te importe ponerte los electrodos que es por tu bien, por tu bien, ¿ a que clase de mundo vamos ?
http://1.bp.blogspot.com/_Imvw6uPq08s/SgStKj8Mh0I/AAAAAAAAAXc/HQpEp1GIWR8/s400/naranja_mecanica.jpg
#004
Mario - 15 agosto 2014 - 19:32
#1. En realidad sí sabemos, intuitivamente, lo que dicen los ToS, y es un trueque información contra servicio. No tiene sentido económico verlo de otra manera. Ahora bien, Correos de España o Telefónica podían haber planteado el mismo negocio, abro tus cartas o grabo tus llamados y ya no te cobro más, pero no existía en el Siglo XX capacidad y velocidad de procesamiento para que este acopio de información fuese rentable o eficaz como negocio.
#2. Bueno sí, precisamente ese es el negocio, pero el problema es que haces con esas reglas tan anticuadas y ese concepto tan poco rentable como son los derechos humanos. Los revolucionarios franceses o los independistas norteamericanos tenían muy fresca la relación estrecha, indesligable, simbiótica entre libertades individuales y la privacidad de las personas. No en balde ambos salían de regímenes absolutistas donde el control social se ejercía negando al individuo ambos derechos. La importancia de estos derechos perduró incluso hasta el fin de la guerra fría y la caída del muro, con un recuerdo muy cercano del funcionamiento de la Stasi alemana y los demás servicios de inteligencia en los totalitarismos comunistas o fascistas. Aceptar pues que ya no existe privacidad o que puedes renunciar a ella es aceptar que estás dispuesto también a rendir tus libertades individuales.
#005
Gorki - 16 agosto 2014 - 02:35
#004 Mario
No creo que elaborar datos del Big Data ataque en absoluto la pPrivacidad, Por ejemplo si se investiga el consumo de agua por barrio y horas, no se puede deducir de ello si determinada persona se lava o no.
Generalmente la información individualizada le interesa al estado y a la policía y deberan ser las Leyes quien controlen lo que puede hacer o no la polícia. A las empresas les interesa más la información sobre grupos. El que un señor no tome sopa, no le importa a las empresas, el que en determinado grupos social, no la tome el 75% de los individuos, si que interesa a las empresas, pero ese dato no va en contra de la privacidad.
#006
Mario - 16 agosto 2014 - 07:59
#005 Gorki. Me temo que tienes una visión totalmente naif de lo que significa vivir en la era de la información y además andas totalmente equivocado con lo que significa Big Data, que pareces confundir con todo lo contrario como fue la simple estadística del siglo XX.
Big Data es definida como la manipulación de grandes conjuntos de datos capturando, almacenando y procesándolos mientras más mejor, sino que Enrique me corrija. Esto es, quién consume tanta agua y con qué frecuencia se lava las manos en tu barrio -para usar tu propio ejemplo- y no al revés, cuánta agua en total se consume en el barrio. Big data implica meterse en tu sala de baño y la de todos tus vecinos y colocar una cámara o sensores a tus grifos conectados a internet para saber al final cuánto se consume en el barrio, en lugar de preguntarle directamente al proveedor de agua potable cuántos hectolitros se facturaron o recurrir a la ciencia estadística como se hacía en el Siglo XX.
«Generalmente la información individualizada le interesa al estado» dices. Falso absolutamente y peligrosamente ingenuo. Eso era antes de internet Gorki, cuando acopiar información individualizada pero a la vez de todos implicaba una barrera tecnológica insalvable para no hablar de una ilegalidad. Hoy TODA la economía de la internet se basa en lo contrario: conseguir solo información individualizada de Gorki específicamente, pero también de todos los demás, para que las agencias de publicidad y las corporaciones puedan afinar lo mejor posible sus ventas y sus utilidades.
Un dato masivo y despersonalizado, típico del marketing del Siglo XX, por ejemplo, «en España un 30% de su población gusta del jamón ibérico y representa un mercado potencial de 14 millones», es pura mierda frente al siguiente dato propio de la era de la Big Data: sabemos que en el mundo 100 millones de personas gustan del jamón ibérico, sabemos dónde están, quiénes son, cuánto ganan mensualmente y cuánto están dispuestos a pagar por darse el gusto.
Entenderás la enorme presión por ganancias corporativas que existe actualmente sobre los gobiernos para permitir que la internet se convierta en el aparato de espionaje y manipulación más eficaz de la historia, aplastando en su camino cualquier posible impedimento legal como puede ser el derecho a la privacidad.
#007
Alejandro - 18 agosto 2014 - 14:51
No sólo en este ámbito, en la monitorización de sistemas todo lo que se está presentando va más alineado con la detección de comportamientos anónalos, que se salen de tendencias , que la mera superación de umbrales , y como comentas requieren un perido de aprendizaje sobre que es «normal»