Clearview y los límites del scraping

IMAGE: Gerd Altmann - Pixabay

Clearview AI es una compañía norteamericana dedicada al reconocimiento facial, que desde su fundación en 2017 ha mantenido una operativa muy particular: hacer scraping de multitud de servicios en la web en los que se pueden encontrar fotografías de personas junto con su nombre o algún detalle de su identidad, y utilizarlas para crear una enorme base de datos con más de veinte mil millones de retratos. Si puedes encontrar una fotografía tuya en la web acompañada de tu nombre, es más que probable que estés en la base de datos de Clearview (y en algunas otras).

La idea de hacer scraping de la web para hacerse con todo tipo de datos es obviamente muy potente, y son múltiples las sentencias que acreditan el procedimiento como legal. Clearview, sin embargo, es un claro ejemplo de hasta qué punto este tipo de procedimientos pueden ser abusados y convertidos en algo que, aunque pudiera ser legal en su origen porque se limita a recolectar datos que están disponibles en repositorios públicos, da lugar a unos resultados que vulneran abiertamente todo tipo de protección razonable de la privacidad. De hecho, el problema con Clearview no se limita a la forma en la que obtiene sus datos, sino también a cómo, a quién y con qué finalidad los comercializa.

Las tecnologías de reconocimiento facial tiene un nivel de madurez relativamente elevado, pero no están en absoluto exentas de errores, más aún cuando se utilizan con personas que pertenecen a grupos étnicos diferentes al predominante con el que han sido alimentados sus algoritmos. De ahí que el uso de este tipo de tecnologías puedan ser problemáticas, y más aún cuando la herramienta se vende a agencias de seguridad y a gobiernos autoritarios de todo el mundo, o se utiliza como juguete para millonarios.

Compañías como Twitter, Meta (en concreto, Facebook e Instagram) y muchas otras han intentado que Clearview deje de hacer scraping de las fotografías de sus usuarios, pero no ha sido hasta principios de este mes de mayo cuando la compañía ha cerrado extrajudicialmente una demanda de la American Civil Liberties Union (ACLU) que únicamente le impedirá vender el acceso a su base de datos a compañías privadas, no así a agencias estatales o gubernamentales. Países como Australia, Francia, Italia y el Reino Unido han multado a Clearview y exigido la retirada de las imágenes de sus ciudadanos de su base de datos, pero la compañía y su CEO, Hoan Ton-That, afirman que «Clearview AI no tiene sede en la UE, no tiene clientes en la UE, y no realiza ninguna actividad que implique que está sujeta a la GDPR», lo que lleva a dudar de la efectividad de esas peticiones de eliminación y deberían motivar a los países demandantes a emitir una orden de busca y captura internacional contra él y contra todos los directivos de su compañía.

Tras la compañía, el siniestro Peter Thiel, el cofundador de PayPal que utilizó buena parte de sus beneficios para crear otra compañía igualmente polémica por motivos similares y que posiblemente sepa más de ti que tú mismo: Palantir. Una prueba de que el uso de la web y de la información que contiene debe tener límites, y que no es tanto la herramienta que se utiliza como con qué finalidad se hace.


This article is also available in English on my Medium page, «Clearview: scraping the barrel»

5 comentarios

  • #001
    FER - 23 mayo 2022 - 15:28

    Palantir … no se podrá decir que cuando puso el nombre a la compañía no dejaba claras sus intenciones. Si Tolkien levantase la cabeza … Me temo que esta es una batalla perdida, y que hay ya muchos ojos de Sauron observándonos.

  • #002
    Xaquín - 23 mayo 2022 - 16:53

    Y siempre volvemos a lo mismo, fijarse en la paja del ojo ajeno mientras no se quiere ver la viga que se aposenta en el nuestro.

    Tanta tanta privacidad, para luego desoír todo consejo sobre filtros mentales necesarios. No solo para saber a quien entregas datos, como para saber que muros debes construir para disminuir su potencial abuso contra tu intimidad.

    Tanto preocuparse de los filtros ajenos que nos ponen en Instagram y demás parafernalia anti-privacidad, incluidas las cámaras omnipresentes. Como si, hasta el más lerdo de los pandilleros de barrio, no descubriera ya hace tiempo que una visera de los Nets te ayuda más que cualquier legislación ad hoc. Y no se puede decir que la visera, es un filtro mental precisamente muy sofisticado.

    Simplemente porque tu visera es tuya y no te la manipula nadie, mientras que la legislación se manipula como nada, en las fuentes del poder establecido, y sus magnánimas delegaciones.

    No cabe duda que el hecho de estar fichado por la policía, da una coraza especial contra este mediocre pavor a perder nuestra sacrosanta virginidad. Que le digan al quinqui número tres millones, que se preocupe de lo que dice la pasma sobre que «le puede ir la vida en ello». Como si el quinqui tuviera vida propia, para sentir que pierde algo importante.

    Ni pasar por la policía, ni ver pelis como Deprisa, deprisa le vale al miedoso de turno. Es lo que se puede llamar hipocondría de la intimidad.

    Y todo esto aderezado por la salsa de un neozar, que nos puede freír a todos en menos que canta un gallo. ¡Joder con el Trump, que se ha clonado rápido!

  • #003
    menestro - 23 mayo 2022 - 18:50

    A ver, en toda Europa, el scraping de datos personales, fotos, email, direcciones, etc. es ilegal.

    Es parte del GDPR la protección de datos de carácter personal, en un lugar público, o no. Y lo acabará siendo en EE.UU. como ha sucedido con el reconocimiento facial.

    Solo que allí, su legislación está más fragmentada en las diversas jurisdicciones de cada estado.

    Qué con el asunto del reconocimiento facial me tuve que estirar en unos cuantos comentarios, hace tiempo, hasta que empezaron a caer la sentencias en EE.UU. y se ha empezado a vetar su uso público.

    Porque sin el expertise, que dicen los finos, de quienes nos dedicamos a esto, la gente podría pensar otra cosa, y claro, no queremos que alguna Pyme o un estudiante se confundan y acaben con un multazo de la AEPD.

    Peter Thiel no tiene nada de siniestro, es un palurdo con dinero o bigot, como Steve bannon.

    De hecho, la noticia que no veo enlazada en el artículo es, que Clearview AI ha sido condenada a borrar sus datos de ciudadanos británicos en una reciente sentencia judicial, que la obliga a pagar 7,5 millones de libras (Casi 9 millones de euros, flojita) hace unos días, al igual que ha sucedido en Australia, Italia (20 millones de euros de multa) y Francia.

    La empresa ha alegado que la ICO no tiene jurisdicción en NY, EE.UU., erróneamente, porque sí que está sujeta por el Privacy Shield 2.0, el nuevo acuerdo de transferencia de datos entre EE.UU. y Europa, por lo que acabará enfrentando problemas legales en EE.UU., además de no poder comercializar su software en terceros países.

    El Privacy shield 2.0 es la razón por la que volvemos a tener la previsualización de enlaces en Instragram, y todas las compañías de EE.UU. como Meta, Twitter, etc., han firmado el acuerdo para gestionar los datos bajo esa nueva legislación.

    Todas esas compañías de Silicon Valley and beyond, no pueden realizar negocios con empresas que no cumplan ese acuerdo bilateral, que es vinculante con las sentencias del Consejo Europeo de Protección de Datos (CEPD).

    Será interesante conocer la valoración de personas como Max Schrems, fundador de la ONG «Europa versus Facebook» , que probablemente pongan en el punto de mira las actividades las compañías de Thiel.

    Sí, la otra empresa de equipamiento militar de Thiel se llama «Anduril», es un hombre de un solo libro.

    Noyb – “none of your business”

  • #004
    Juan T. - 23 mayo 2022 - 19:37

    Leí un libro de Peter Thiel «Zero to one», que me pareció muy interesante, antes de saber quien era el pájaro, un elemento al que teme todo Silicon Valley, donante de Trump, y psicópata de libro.

    Y ahora va el Elon, que tanto le criticaba, y bien conocido por el como socio de Paypal y hace público que va a votar al Partido Republicano…Si;si, al actual Partido Republicano.

    Joer con los genios, en cuanto les tocas la pasta o no les dejas hacer lo que les salga (y yo creo que ese es mas bien el motivo de Musk, que no admite ningún obstáculo gubernamental a sus empresas, como dice del Partido Demócrata), pues a vengarse.

  • #005
    Gorki - 23 mayo 2022 - 21:06

    El problema como siempre esta en la frontera, Todos tenemos una colección de fotos, todos tenemos una un listín de teléfonos, todos tenemos una colección de direcciones postales una colección de discos, y claramente es legal. pero si el tamaño de la colección varia y son varios millones de fotos, entonces es scraping, y la guía blanca y azul de Telefónica, con todos los telefonos ordenados por apellidos y calles que antes era gratuita, hoy seria ilegal.

    Donde está la frontera. Yo considero que por ejemplo que el derecho al olvido, es absurdo, en cuanto que es legal leer hemerotecas, sin embargo comprendo que quien siendo joven tuvo un desliz legal, le moleste que aun siga apareciendo en su curriculum.

    Donde está la frontera.

Dejar un Comentario

Los comentarios están cerrados