Web scraping: ¿legal, ilegal, o depende?

LinkedIn scrapingUn juez norteamericano ha ordenado a Microsoft que elimine en un plazo de 24 horas toda tecnología destinada a impedir que una compañía, hiQ Labs, obtenga datos públicos de LinkedIn mediante web scraping. Específicamente, lo que el juez afirma al conceder el recurso interpuesto por hiQ Labs ante la afirmación de LinkedIn de que era ilegal hacer scraping de su página web sin su permiso, es que LinkedIn no puede prohibir ni bloquear el acceso selectivo de una compañía a datos que han sido hechos públicos a través de su servicio.

La compañía, hiQ Labs, se dedica a recolectar datos de diversas fuentes para, según ellos mismos, ayudar a los directivos a tomar mejores decisiones sobre las personas, básicamente atraer o retener talento. La práctica de extraer datos de diversos servicios es habitual entre startups de analítica, sobre todo en la fase en la que intentan construir su oferta de servicios y aun no cuentan con la masa crítica suficiente como para intentar obtener esos datos por sí mismas. Los servicios de analítica de ese tipo son cada vez más habituales a medida que resulta más posible obtener imágenes útiles de un usuario a partir de los datos que comparte en páginas sociales de diversos tipos.

En otras ocasiones, como en el caso de Facebook contra Power Ventures en 2009, los tribunales han decidido en favor de la página objeto del scraping: en ese caso, lo que Power Ventures intentaba era ofrecer un servicio que supuestamente consolidaba todos los contactos de un usuario en diversas redes sociales en una sola página, con lo que el scraping de los datos se llevaba a cabo con el permiso explícito de un usuario que permitía a la aplicación acceder a su Facebook. Sin embargo, el hecho de que Facebook hubiese enviado a Power Ventures un cease and desist conminándole a dejar de acceder  su servicio suponía una rescisión de ese permiso, y por tanto, daba la razón a Facebook. En el caso de LinkedIn contra hiQ Labs, en el que también medió el envío de un cease and desist, el juez ha optado, sin embargo, por dar la razón a la pequeña startup, posiblemente en parte porque la propia LinkedIn permite el scraping de los perfiles de sus usuarios por otras compañías como motores de búsqueda con el fin de mejorar su propia propuesta de valor. 

Obviamente, no parece lo mismo obtener datos de una página mediante scraping cuando lo que pretendes hacer con esos datos es sustituir el servicio que proporciona la compañía en cuestión, frente a cuando ese scraping es simplemente una manera de desarrollar un servicio completamente diferente y no esencialmente relacionado con el original. Como todo, la cuestión tiene sus matices: acciones de scraping aisladas para completar perfiles de usuario concretos, por ejemplo, no parecen tener la misma naturaleza que acciones masivas destinadas a extraer cantidades masivas de datos.

En cualquier caso, la resolución de ayer no es más que el principio de la cuestión: Microsoft ha anunciado que apelará la medida, y por el momento, todo indica que quien pretenda basarse en datos de terceros para construir su propuesta de valor debería hacerlo en virtud de un acuerdo con la compañía correspondiente, o arriesgarse a verse implicada en costosos procesos judiciales.

 

 

 

This post is also available in English in my Medium page, “Web scraping: legal, illegal, or does it depend on the circumstances?» 

 

12 comentarios

  • #001
    JJ - 15 agosto 2017 - 14:56

    No hace mucho, alguien me comentó que se había vuelto a dar de alta en Linkedin y que le sorprendió la exigencia de tener que darles acceso a todos sus contactos del correo electrónico, una practica que antes hacía Facebook, pero que luego, felizmente, abandonó.

    Creo que Linkedin (Microsoft) roba información descaradamente, como todos, en estas épocas de total inconsciencia acerca de lo que significa ser propietario de la propia, valga la redundancia, información personal.

    Todos roban informacion personal, siempre que lo permitimos, o que no lo impedimos, (por pura ignorancia o porque no existen alternativas), como con la mayoría de Apps para smartphones, algo que ya resulta hasta escandaloso.

    En consecuencia, teniendo en cuenta esta forma de corrupción generalizada, creo que el juez acierta en este caso.

    El que roba a un ladrón, también es ladrón, pero merece 100 años de perdón.

  • #002
    Pedro Amador - 15 agosto 2017 - 17:20

    Linkedin permitía extraer con distintas herramientas todos los contactos de manera bastante sencilla. Ahora controlan que no se accedan a unos cientos por días. Por supuesto, ahora controlan también que las noticias no lleguen a todos los contactos.

    En cuanto salen a bolsa… ¡las compañías se vuelven locas en ganar y ganar dinero!, y el servicio al usuario se olvida.

    Me alegra mucho esta demada a favor de la Startup, que le da la razón al servicio frente a los abusos de los grandes.

  • #003
    Benji - 15 agosto 2017 - 17:39

    Yo lanzo el 4 de Septiembre una web para músicos. Para poder localizarles y ofrecerles mis servicios he hecho web scrapping como un poseso y conseguí 72.000 direcciones de email. De ahí pagué a HubuCo para que me las filtrase y me dejaron con 41.800 direcciones válidas.

    ¿Es ético? Pues si la información está disponible… si no quieren que se les contacte no la pondrían ahí. ¿Es práctico? No tanto, ya que tus usuarios no saben que se lo has hecho hasta que llega tu primer email.

    Yo creo que debería ser posible o muchas startups como la mía no tendrían ni por donde empezar. Por otro lado, están lo que hacen spam con esto y lo abusan. Es como todo, una gran herramienta y oportunidad, tanto para el bien como para el lado oscuro

    • Javier - 15 agosto 2017 - 20:53

      #003 Benji. Estás en tu derecho a hacerlo, pero desde el punto de vista del marketing, de conseguir prospectos que de verdad estén interesados en tu producto o servicio … te deseo suerte con la estrategia.

      Si quieres, me ofrezco voluntariamente a ayudarte sin compromiso, a que llegues a tu audiencia ya sea mediante Google o Facebook. Un saludo.

    • JJ - 15 agosto 2017 - 23:18

      Creo que lo que hiciste no está mal. Solo recopilas datos con un fin concreto; conseguir ganarte un mercado para tu nueva web (a propósito, me interesa, porque soy músico, aunque amateur). Otra cosa es robar datos a gran escala para venderlos a quien sea y para lo que sea.

      No estoy de acuerdo, por ejemplo, con el comentario de Pedro. Me da igual que se repita una y otra vez que si un servicio es gratuito debes pagar con tus datos. Y que si no quieres que esto ocurra que no te des de alta en tal servicio gratuito.

      El que se repita esto una y otra vez no justifica el abuso reiterado. Ni en los servicios online ni mucho menos con las Apps, que exigen permisos absurdos para que puedas instalarlas. Y no dan alternativa, o aceptas lo que sea o te quedas sin nada, porque en la mayoría de los casos no existe alternativa, ni de pago, ni de otro tipo de App similar.

      Esto tiene que cambiar. Pero en la medida que no seamos conscientes, o lo justifiquemos con la excusa que sea, las cosas seguirán igual o, lo mas probable, irán a peor.

      Me gusta, en sentido poético, la metáfora del pirata. Pero la idea de que Internet es un océano sin reglas y donde todo vale me parece absurda. Veo que, a medida que pasa el tiempo, vamos teniendo una red mas segura y civilizada. Amén.

      • Francis Leyba - 23 agosto 2017 - 02:33

        He estado pensando mucho sobre esto, y no creo que los usuarios puedan hacer mucho. Solo las leyes, lo que es dificil, o, al menos, un juez valiente. Pero luego recurren al tribunal superior, y las cosas cambian.

  • #007
    Pedro - 15 agosto 2017 - 17:43

    Se ha repetido hasta la saciedad que cuando usas un servicio gratuito, el producto eres tú. Y tus datos.

    Si no quieres ser tú el producto, no te des de alta en ese servicio.

    Si quieres tener datos de mucha gente búscate la vida, no «robes» los datos de las demás empresas. Deberías tratar de llegar a un acuerdo previo.
    Si no hay acuerdo, ni un juez debería poderte impedir el acceso a los datos públicos. Otra cosa es cuando para acceder a los datos que te interesen tengas que acceder a la parte privada de los datos: me parecería bien que no te dejasen.

    • acerswap - 15 agosto 2017 - 18:59

      Una cosa es acceder y otra abusar. Imagina que la empresa que hace uso de los datos que la otra recopila hiciera un uso tan intensivo que se comiera los recursos de la otra. O que la parasitara de tal manera que toda la inversion la realizase la que consigue los datos.

  • #009
    Xaquín - 15 agosto 2017 - 18:19

    Pienso en aquel muchachote que se fue a bañar al mar por primera vez y protestaba porque la corriente lo llevaba mar adentro. No entendía que le faltara una orilla…

    Internet es un óceano, sin orillas reales y con megatiburones y megasubmarinos… y lo que te rondaré morena!

  • #010
    Ruben - 17 agosto 2017 - 12:41

    Me sorprende que todo gire alrededor de si una empresa tiene derecho a recopilar y usar los datos que publica otra empresa, y nadie hable de los derechos de los verdaderos dueños de esos datos, que son las personas.
    En España existe una normativa muy estricta (a mi modo de ver incluso demasiado estricta) sobre el uso que se puede dar a los datos de carácter personal. Incluso sobre qué se considera un dato de carácter personal. Sorprende por ejemplo que un número móvil no sea un dato de carácter personal y sin embargo una dirección IP lo sea…. o una dirección de email… pero esa es otra historia…
    Yo como usuario, cuando entrego voluntariamente mis datos para que se publiquen lo hago en un escenario específico, y es que esos datos van a ser públicos con un fin, como que una empresa busque mi perfil (si hablamos de linkedin) o que otro usuario pueda tener información sobre mi por diversos motivos (si hablamos de Facebook por ejemplo). Pero en ningún momento me planteo que mis datos públicos puedan usarse con motivos comerciales por terceros que no tienen que ver siquiera con las empresas a las que les he cedido mis datos (porque OJO, los datos siguen siendo míos, yo los he cedido, y mañana puedo requerir que los eliminen). Y de hecho la legislación me protege en ese sentido, aunque como digo pueda ser más o menos discutible qué datos son personales y qué uso se pueda dar en base a las condiciones de su publicación.
    La información pública, se entiende de personas físicas, se puede copiar sin problemas; otra cosa bien distinta es el uso que se puede hacer de esa información pública sin infringir la LOPD

  • #011
    Mcallan - 17 agosto 2017 - 20:46

    Web scrapping es todo lo que las OTAS de viajes hacen con las compañias aéreas lowcost atraves de travelfusion y por ahora es legal, Otra coas es la aplicacion que empresas con ED hace de ello.

  • #012
    Francisco Marchal - 25 agosto 2017 - 15:57

    La pelea está en si esas empresas tienen derecho a explotar esos datos o por el contrario estos únicamente pertenecen a la web a la que se le ha hecho el scraping.
    Vamos que aquí nadie se acuerda de que esos datos proceden de personas con derechos a la que se les está tratando puramente como ganado comercial

Dejar un Comentario

Los comentarios están cerrados