Link rot: la insoportable levedad de la web

IMAGE: lucadp - 123RFUna referencia de Lawrence Lessig me lleva a profundizar un poco en el concepto de link rot, link death o link breaking: el fenómeno que ocurre cuando aparecen vínculos en la web que apuntan a recursos que ya no están disponibles.

Un problema cuya importancia tiende a ser subestimada: el Error 404 es parte habitual en la vida de cualquier usuario de la red y casi forma parte de una rutina de resignación, pero cuando esos errores afectan cada semana a uno de cada doscientos enlaces, cuando la mitad de los enlaces utilizados en literatura académica no están disponibles diez años después de su publicación, o cuando la mitad de las referencias de jurisprudencia del Tribunal Supremo de los Estados Unidos no funcionan, nos damos cuenta de que, en realidad, estamos prácticamente construyendo toda una fase del desarrollo cultural de la humanidad sobre unas bases inadecuadas.

El problema no tiene una solución sencilla: con la popularización de herramientas que dan lugar a un descenso brutal en las barreras de entrada a la publicación, llegamos a un escenario en el que muchos recursos en la red son creados con una mentalidad puramente coyuntural o simplemente no son sujetos a un mínimo trabajo de mantenimiento. En el caso de publicaciones periódicas, la visión unidireccional es relativamente habitual: modificar la estructura de un recurso para situarlo en un archivo, tras una barrera de pago, o simplemente hacerlo desaparecer para reducir costes de almacenaje y mantenimiento es una práctica desgraciadamente habitual, que no tiene en cuenta el hecho de que la naturaleza de la web lleva a que ese recurso pueda tener importancia no solo por la información contenida en sí mismo, sino también en virtud de las referencias que apuntan a él.

Una serie de iniciativas intentan trabajar para minimizar la criticidad del link rot: además del conocido Internet Archive, que ofrece una especie de limitado “viaje en el tiempo” para poder acceder a capturas de páginas en función de periódicos almacenes en su archivo, surgen otros recursos, como DeadURL.com, que añadidos al inicio de una dirección muerta, intentan acceder a salvaguardas funcionales de la misma en diversos archivos. O herramientas como Evernote, Peeep.us o Instapaper, que generan una copia del recurso en una URL independiente que permanece activa incluso si el recurso original deja de estar disponible. Desde el ámbito académico surge WebCite, un recurso libre de coste sufragado por editores (que ha anunciado que no admitirá más recursos a partir del final de 2013 si no es capaz de alcanzar sus objetivos de financiación), o Perma.cc, gestionado por una serie de bibliotecas universitarias bajo la iniciativa de la Harvard Library Innovation Lab.

Por el lado de los creadores de páginas, es preciso generar una cierta conciencia con respecto al problema: tratar de vincular a recursos con una cierta vocación de permanencia, utilizar repositorios de uso personal con backups de los recursos vinculados mediante herramientas como las citadas, o revisar con cierta regularidad lo publicado con herramientas de detección de enlaces rotos. Una herramienta en desarrollo de IBM, Peridot, permite automatizar la detección de esos enlaces rotos y propone su actualización a partir de una serie de características únicas del documento vinculado. En mi caso, hace ya mucho tiempo que añado la versión en pdf de los artículos que me publican en muchas fuentes, tras haber comprobado que, a lo largo de casi once años de mantener mi blog, una parte significativa de los enlaces, sobre todo los más antiguos, ya no está disponible.

La insoportable levedad de la web puede ser, en muchos de sus determinantes más profundos, una parte de sus características. Pero para algunos casos, desde jurídicos hasta académico-científicos, pasando por editoriales, es un problema que requiere un replanteamiento de muchos factores que habrá que ir anticipando y teniendo en consideración. Pasar de lo más obvio – constatar que hay muchos enlaces rotos – al desarrollo de sistemas y protocolos que permitan al menos atenuar su importancia es parte de una fase de consolidación de la web por la que necesariamente hay que pasar.

 

(This post is also available in English in my Medium page, “Link rot: the unbearable lightness of the web“)

11 comentarios

  • #001
    Antonio Castro - 25 septiembre 2013 - 10:21

    En cierta ocasión publiqué un artículo para dar a conocer una asociación con la cual estaba vinculado. Con los años ese artículo se convirtió en algo muy estúpido porque la asociación a la que se refería decidió modernizar su web, cosa que hacen cada dos años o así y el enlace quedó roto. Lo que tuve que hacer es suprimir el artículo. (espero que nadie lo enlazara).

    Esa asociación en una de sus reestructuraciones de la web, estuvo a punto de renunciar a su dominio para no tener que depender de un servicio de hosting y usar un servicio gratuito más sencillo de usar.

    Al amiguete que parece que sabe de ordenadores se le pide el favor y listo.

  • #002
    Felipe Alfaro Solana - 25 septiembre 2013 - 10:43

    Yo pensaba que precisamente ésto es lo que ya estaba haciendo Google desde hace tiempo: indizar la red y a la vez almacenar versiones históricas de dichas páginas.

  • #003
    Xaquín - 25 septiembre 2013 - 14:05

    Resulta curioso lo apropiado del título, mucho más (en cuanto a “entendible”) que usando la palabra ser. No hai como internet para entender la virtualidad de cualquier cosa.

  • #004
    Diego - 25 septiembre 2013 - 14:58

    Añadiría una mención a los tan populares, hoy en día, acortadores de URL. Cada vez son más los usuarios que los utilizan, incluso cuando no es necesario (muchas veces no hay una limitación de espacio). Si alguno de estos servicios desaparece, todos sus enlaces quedarán ‘muertos’.

  • #005
    necudeco - 25 septiembre 2013 - 15:51

    Es imposible mantener en vigencia toda la informacion de la web sin un modelo de pago, todas las personas buscan ganar … y cuanto mas mejor.

    Sin embargo, en cuanto a un protocolo alternativo. Se podria desarrollar un navegador p2p donde cada vez que tu te conectas a navegar en internet tambien estas almacenando y sirviendo informacion a otros. Claro esto solo valdria para informacion estatica, tipo wikipedia …. mas no para transacciones, pero seria un avance.

    Saludos

  • #006
    Carlos (Econ) - 25 septiembre 2013 - 16:19

    Un enlace de wikipedia caduca lo mismo que las entradas de un diccionario.

    ¿Hasta que punto es un tema de calidad y no de cantidad? ¿Queremos un archivo de toda la web, o solo de lo que es relevante?

    ¿Y como crear un repositorio de lo que es relevante si todo tiene derechos de autor que viven mas que Matusalem?

    El dominio público es una necesidad que los ciudadanos hacemos real, pero sin los recursos y posibilidades de los estados o empresas…

    Wikipedia podría estar enriquecida con fotos y videos, pero gran parte del esfuerzo se va en cumplir la ley y solo usar aquello que la comisión Sinde de turno diga que se puede usar…

    Estamos como Stallman en el 83, cuando inicio el proyecto GNU… Todo esta por hacer, y termina con la mega empresa del momento cogiendo todo el trabajo para forrarse… (ANDROID) El terco de Stallman en su cruzada Quijotesca… Y ahora su código esta en todo el mundo y anuncia el acorralamiento del software propietario en nichos…

    ¿Vamos a hacer todo el trabajo de responder a los retos de internet y la tecnología, enfrentándonos con desobediencia a las estúpidas leyes que perduran? ¿Para que al final venga una empresa y se forre?

    Pues si… No les quepa duda… Y esa empresa se va a forrar RESPETANDONOS.

  • #007
    Carlos (Econ) - 25 septiembre 2013 - 16:46

    #005 ¿Acaso CR7 estaba triste porque quiere ganar mas?

    El dinero solo es una vara de medir, lo que queremos es ser “MAS” que el vecino, el compañero de trabajo, el familiar… Depende de con quien te compares…

    Es el “relativismo”.

    Tu discurso es el de Bill Gates, que creia que el futuro era el software propietario…

    Mira por donde medio mundo ya tiene Android en la palma de la mano…

    No malgastes tu vida buscando donde nace el arcoiris. El dinero es necesario, pero no es suficiente para la felicidad y para quienes piensan como tu, es un estorbo…

    En la piramide solo hay uno que no tiene a nadie que está por encima.

    Se llama Mesi… Si Mesi es infeliz… Entoces apaga y vamonos :-)

    Un saludo

  • #008
    Pasando - 25 septiembre 2013 - 18:14

    Artículo sobre el embajador de EEUU en España, sobre las descargas en la red:
    “es un problema en el que nos vamos a centrar. Estoy deseando colaborar con el Gobierno de España para resolverlo. El problema no es tanto de leyes, que existen, como de falta de aplicación, de que no se imponen debidamente”.

    http://politica.elpais.com/politica/2013/09/24/actualidad/1380050760_627241.html

    Un claro ataque a la soberanía de nuestro país. El deber de un embajador es representar su país en un país extranjero, no gobernar ni aplicar leyes en el país extranjero.

    ¡Qué vergüenza!

  • #009
    mercadder - 25 septiembre 2013 - 18:53

    El administrador de una web es quien debe velar por que los enlaces esten funcionando. Mantener un historial de la web es tal como hacer una hemeroteca de la prensa diaria, es válido para el que investiga pero carece de utilidad para el otro 99% de los mortales.

  • #010
    Enrique Lucena - 25 septiembre 2013 - 19:09

    y hay un tango sobre el tema http://www.youtube.com/watch?v=3yoX085P2SM

  • #011
    asmpredator - 25 septiembre 2013 - 23:28

    Muchas veces cuando buscas información te encuentras que desde infinidad de paginas distintas se enlaza a la misma información o que hay enlaces que están encadenados a otros para llegar al mismo punto creando una maraña enrevesada de enlaces que no llevan a ningún sitio.

Dejar un Comentario

Los comentarios están cerrados