El problema de mantener los enlaces vivos

IMAGE: Max Pixel (CC0)

Un buen artículo en The Conversation, «Your internet data is rotting», promueve la reflexión en torno a un tema especialmente sensible para alguien como yo, que lleva más de dieciséis años manteniendo una página en la red: la muerte de los enlaces, o link rot.

Internet es una red en permanente crecimiento, lo que implica que es también una red en permanente cambio. El link rot es el proceso por el cual los enlaces en sitios web tienden a apuntar a páginas web, servidores u otros recursos que ya no están disponibles, generando errores 404 que, por un lado, disminuyen la relevancia de la página y pueden llegar a afectar a su visibilidad, y por otro, generan frustración en sus visitantes. Cuando mantienes una página desde hace años, se hace completamente evidente: basta con remontarte a artículos de hace algunos años, para encontrar multitud de enlaces que han dejado de funcionar. El problema ocurre en todo tipo de páginas, independientemente de su relevancia: hace algunos años, se calculó que el 49% de los enlaces citados en sentencias del Tribunal Supremo de los Estados Unidos estaban rotos.

El problema afecta de muchísimas maneras: artículos a los que enlazaste contenidos en publicaciones que han dejado de existir, vídeos que ya no están disponibles, cambios de dirección debidos a múltiples causas, y para el propietario de una página mantenida por una sola persona, como es el caso de esta, se convierte en un problema completamente irresoluble con un esfuerzo y un coste razonable. En mi caso, dado que esta página tiene la función que tiene – servirme para preparar mis clases y contenidos académicos – y mis programas típicamente evolucionan rápidamente, opté hace tiempo por no hacer nada más de aquello que podía solucionar en unos pocos clics, lo que supone, obviamente, resignarse a una cierta pérdida de calidad.

No son pocas las ocasiones, además, en las que a la tristeza de perder calidad en tu página se añade un suplicio adicional: los enlaces rotos son utilizados por oportunistas que poseen contenidos relacionados, y que te escriben mensajes desesperantemente insistentes pidiéndote que corrijas la situación enlazando a los recursos que ellos crearon. Hace tiempo que dejé de hacer caso a esos mensajes, pero el hecho de que se repitan constantemente no deja de ser un recordatorio de una situación que te gustaría poder cambiar.

Por otro lado, existen soluciones. Wikipedia, con un problema de link rot evidente derivado de lo que supone mantener muchos millones de páginas a las que se añaden o cambian alrededor de veinte millones de enlaces por semana, desarrolló hace algún tiempo una herramienta para que sus enlaces, en caso de apuntar a un recurso no disponible de manera permanente, apunten al gran repositorio histórico de la web, Archive.org, y a su máquina del tiempo o Wayback Machine. Algo que en algún momento tendré que plantearme hacer, o que, posiblemente, termine siendo incorporado a las herramientas de publicación habituales. Lógicamente, eso generaría una carga importante de recursos para el gran archivador, que debería por tanto conllevar la generación de algún tipo de financiación para el servicio, que se gestiona como una organización sin ánimo de lucro.

De una u otra manera, y mientras el problema encuentra una solución razonable y escalable, tened en cuenta que generalmente, los enlaces son en muchas ocasiones relativamente fáciles de recuperar, bien investigando un poco mediante una búsqueda abierta de su título, o recurriendo manualmente al propio Archive.org. En la actualidad, siendo consciente del problema, hay algunas cosas que habitualmente hago para intentar paliar en parte el problema, tales como almacenar algunos recursos en pdf y añadirlos al enlace, pero que tampoco me parece respetuoso hacer de manera sistemática salvo cuando el contenido tiene algún tipo de referencia específica a mi actividad.

Para mí, no una obsesión, pero sin duda, sí un problema todavía en busca de una solución.


This post is also available in English on my Medium page, «What are we going to do about those rotten links?«


14 comentarios

  • #001
    Gorki - 19 mayo 2019 - 17:53

    Lo más sencillo es tener una araña que recorriera periódicamente todo el blog y que simplemente quitara el enlace. muerto el perro se acabó la rabia. El problema es el contrario, cuando te traes una imagen de algún sitio y ese sitio desaparece y con ello la ilustración.

    Para esto no tengo fácil solución, Quizá cambiar la imagen por un banner que te invite a suscribirte al blog o algo así. .

    ¿Conoce alguien un programa que haga algo parecido?

  • #002
    Alberto Aranda Aranda - 19 mayo 2019 - 18:01

    Es fácil controlar con un script los link rotos y cancelar ese link!

    • Enrique Dans - 19 mayo 2019 - 18:09

      Es fácil… relativamente. Cuando tienes 8,183 páginas no lo es. Y además, no es lo que quiero. Si quito el enlace, elimino la posibilidad de que alguien lo busque manualmente. Y además, algunas de mis entradas no tienen sentido sin el enlace que, en muchos casos están incluso motivadas por uno. Como académico al que, además, le trae sin cuidado el SEO, creo que la solución de dejarlos como están es mejor que la de quitarlos. Pero sigo manteniendo la esperanza de que a alguien le dé por desarrollar un plugin de WordPress que haga lo mismo que hace el de Wikipedia, enlazar automáticamente a Archive.org cuando el enlace original se rompe…

  • #004
    xaquín - 19 mayo 2019 - 19:58

    Me resulta ajeno el problema. Pero aprovecho para reivindicar de nuevo la autonomía del ser humano.

    En un edificio ultramoderno, con exceso de señales e incluso etiquetas informando para que que vale una determinada sala. ¿Como atacar el fenómeno de que se anulen servicios o se reubiquen en otro cuarto? Menos GPS y más uso neuronal. Adaptarse al nuevo espacio para tener referencias básicas de orientación. Algo que vale para andar por el edificio y para aguantar las sucesivas indicaciones más o menos falsas del personal que está «para informar».

    Lo digo siempre con internet. No deja de ser un edifico practicamente ilimitado. Y no debería ser preciso andar por la vida de hacker para navegar por la red con un mínimo de seguridad como homo sapiens. De hecho será la única posibilidad de sobrevivir en un mundo tecnológico lleno de algoritmos con total IA.

    Pero claro, versionando al otro : con la Educación hemos dado. De renuevo.

  • #005
    Manel Sayrach - 19 mayo 2019 - 21:36

    Hola Enrique,
    No se si una solución como Amber te podría ser útil.
    http://amberlink.org/
    Saludos
    @msayrach

    • Enrique Dans - 19 mayo 2019 - 21:39

      Muchas gracias, Manel, no lo conocía! Lo miro con calma. Un snapshot de la página no es la solución ideal para una página de contenido, sería mejor que se pudiese acceder a los artículos completos, pero tal vez sea mejor que nada…

    • Gorki - 19 mayo 2019 - 22:35

      Tiene buena pinta, paro no tengo claro donde se guardan tantas copia de seguridad de las paginas web que enlazamos, ni entiendo por qué si se hace una copia automática de la página web, se conserva el link hacia la página original, ¿que ventaja tiene?

      . Hay que verlo con más calma

  • #008
    Paco - 20 mayo 2019 - 09:44

    Lo peor es cuando el autor original no renueva un dominio, y éste pasa a ser adquirido por compañías de parking y reventa de dominios, y pasa a ser utilizado para ofrecer productos de otro tipo, que puede ser desde relojes falsificados, juguetes sexuales o tiendas-fake de moda de moda o electrónica, en las que los productos cuestan un 25% de su valor de mercado, y no aparece ningún dato creíble de conctacto.

  • #009
    Luis - 20 mayo 2019 - 10:55

    Enrique: Estoy muy de acuerdo en la importancia de mantener los links accesibles a lo largo del tiempo. La solución que mencionas (https://archive.org/) me parece una buena solución, justo este fin de semana la utilizaba para rastrear una página que me interesaba y que no funcionaba. El reto creo que está en cómo automatizar la vinculación de un link roto a uno de archive.org. Quizás algún tipo de herramienta que ya lo tenga en cuenta cuando se inserte. En el mundo académico se utilzan los links únicos (https://www.doi.org/) y quizás algo similar para esos links podría ser la solución.

  • #010
    Pedro Torres Asdrubal - 20 mayo 2019 - 11:43

    Off-topic: ¿China veta los servicios de empresas yanquís en internet y ahora se tiene que comer el veto de Trump a Huawei?

    Lo peor de las bestias es que tengan «algo» de razón. ¿Hasta que punto Trump está pagando a Beijing con la misma moneda?

    • Gorki - 20 mayo 2019 - 12:01

      Generalmente en las disputas, ninguna de las dos partes tiene TODA la razón, pero cualquiera de ellas tiene PARTE de razón. No puede pretender China preservar su país de la economía capitalista y que la otra parte baje todas sus fronteras porque sí.

      Pero me temo que en esta guerra , vamos a perder todos, hasta los que no participamos en ella.

      • Pedro Torres Asdrubal - 21 mayo 2019 - 12:06

        #012 es para usted.

  • #013
    Pedro Torres Asdrubal - 21 mayo 2019 - 12:05

    Lo que es malo para nosotros e bueno para el planeta. Perder y ganar son términos tan relativos.

    Fdo: el gilipollas que paga siempre.

    :-D

  • #014
    Cruz Gabaldón - 29 mayo 2019 - 08:53

    Hola Enrique, soy seguidora frecuente de tus artículos. No sé si este es el lugar adecuado, para decirtelo e imagino que lo tienes controlado. Aprovechando el tema del artículo ¿sabes que tu enlace a Google+ está roto, verdad?.
    En el buscador por temas de la izquierda.

Dejar un Comentario

Los comentarios están cerrados