La insoportable levedad del PageRank

Ayer, tras una conversación por e-mail con Julio (que me permitió comprobar que no soy el único con tendencia a la nocturnidad), comprobamos algo que llevábamos tiempo sospechando: la insoportable levedad del algoritmo PageRank que determina el Google Score de una página. Entré en Merodeando a través del vínculo de uno de mis comentarios, y me encontré con un PageRank de cero. Tras darle un par de golpecitos a la pantalla como quien se los daría al indicador de la gasolina del coche y comprobar que allí no pasaba nada (anda que si llega a pasar…), le puse un mensaje a Julio informándole/preguntándole sobre el tema. La respuesta inmediata me proporcionó la evidencia de un Poltergeist, o fenómeno extraño: cuando entrabas en Merodeando poniendo como dirección www.merodeando.com, el PageRank aparecía como cinco. Si quitabas las tres w, aparecía como cero. Por supuesto, la página era la misma, porque cuando compras un dominio, dispones de la posibilidad de usarlo con www o sin www indistintamente. Pero, a sugerencia de Julio, pasamos a mi caso: si entras en edans.blogspot.com, tengo un PageRank de cinco. Pero si entras en www.enriquedans.com. resulta ser de cuatro. Tanto si quitas la www de la segunda dirección como si la añades en la primera, el resultado es cero. Pero, por supuesto, la página es exactamente la misma en los cuatro casos. Ya puestos a comprobar estupideces, entré en http://terra.es, y comprobé como un PageRank de 5 se convertía mágicamente en un 8 cuando añadías la triple W, siendo por supuesto la misma página y con la misma «relevancia» a todos los efectos…
 
¿Resultado lógico? El PageRank es un asco. Está mal hecho. La idea de medir la importancia de una página en función de la cantidad de links que apuntan a ella está conceptualmente bien, pero si con toda la materia gris que Google concentra entre sus paredes, no son capaces de entender que todos los vínculos a una página, con cualquiera de sus dos dominios y con www o sin él, son exactamente lo mismo, es que a lo mejor estamos basando la clasificación universal de la Red en un algoritmo débil, malo y poco fiable. Penalizar a una página porque ofrezca múltiples maneras de llegar a ella es simplemente estúpido. Lo importante es la página y su contenido, no que el vínculo por el cual llegues a ella esté escrito con www o sin él. Esto es una demostración de que Google, en realidad, no sabe calcular el valor real de una página, sino que lo mantiene en la más absoluta de las relatividades, en función de cuestiones triviales e irrelevantes. En una Red en la que cada vez se intenta dar más facilidades al usuario y ofrecer más vías de acceso a un mismo contenido, el PageRank mantiene una estúpida obsesión por la literalidad del vínculo que lo desvirtúa, le quita valor, lo convierte en ridículamente impreciso.
 
Ni pensar ya lo que pasa con la segunda derivada: cuando recibes un link de una página importante, este «puntúa» más para el PageRank que si lo recibes de una página poco importante. Si mi página es vinculada desde Terra, ¿que recibo en realidad? ¿El vínculo de una página de 5 o el de una de 8? ¿O dos vínculos, uno de 5 y otro de 8, dado que para la limitada inteligencia de Google son páginas diferentes?
 
La contabilidad de Enron es más fiable que el PageRank. Al menos, con la contabilidad de Enron siempre sabíamos que se equivocaba en el mismo sentido.

20 comentarios

  • #001
    ronsel - 20 julio 2004 - 09:26

    Estamos acostumbrados a pedirle demasiado a Google. Os acordais Cómo indexaban antes los buscadores? Metas y número de veces que se repetía la palabra?

    Seguro que lo pueden hacer mejor los de Google, pero me da la sensación que el siguiente paso ya entra dentro de la IA.

  • #002
    Pablo Martinez-Almeida - 20 julio 2004 - 09:36

    Que tomen nota en Google Dirson. Precisamente las diferencias en el pagerank de tu blog las reseñamos en Merodeando hace cosa de un mes. Fíja te en los comentarios.

  • #003
    Francisco Mesa - 20 julio 2004 - 09:42

    Pues creo que tiene fácil solución, se le comenta, y lo resolverán. O, en su defecto, se puede llegar más lejos y hacer como Alexa, que reconoce (automáticamente o por solicitud) las webs que tienen los mismos contenidos para sumar su difusión.

  • #004
    Juanjo Navarro - 20 julio 2004 - 09:51

    Yo creo que es algo injusto esta forma de verlo.

    Para empezar no hay ninguna regla que diga que lo que hay en enriquedans.com es lo mismo que lo de www.enriquedans.com. Tu podrías poner dos páginas completamente distintas en cada uno de los dos URL. No digamos nada ya si pretendes que se de cuenta de que dos url completamente distintas como enriquedans.com y edans.blogspot.com son el mismo contenido.

    Un saludo.

  • #005
    Héctor C. - 20 julio 2004 - 10:47

    Al menos los de la plataforma www. is pedrecated (http://no-www.org/) estarán contentos. Pueden hacer estadísticas de la gente que accede a una página a través del www. y sin el ;)

  • #006
    Francisco Mesa - 20 julio 2004 - 23:57

    Como no lo había hecho anteriormente, les he enviado el comentario sobre las diferencias de PageRank. Anteriormente SIEMPRE me han contestado satisfactoriamente a mis preguntas, veremos que pasa con ésta.

  • #007
    Ricardo Figueroa - 21 julio 2004 - 00:23

    Enrique, discrepo con tus comentarios. Pienso que bastante tiene Google indexando miles de millones de páginas, terabytes de información, y tiempos de respuesta a búsquedas de milésimas de segundo, como para exigirle comparar similitudes entre páginas. Ciertamente utiliza criterios relativos para rankear páginas, pero requeriría una capacidad de procesamiento incalculable para comparar los miles de millones de páginas de su BD y tan solo para diferenciar un Pagerank de 5 vs. 4, que tampoco es muy relevante. Además que criterio se puede utilizar para definir que página es mas importante que otra si no es por vínculos referenciados. Difícilmente podrían interpretar que contenidos son mas relevantes que otros. Por ejemplo tu blog es, desde mi punto de vista, de los mas interesantes referentes a TI, pero con palabras claves adecuadas de TI puedes colocar un website porno en un ranking bastante aceptable cuando alguien quiera buscar tu blog. Requeriría de mucho mas inteligencia para reconocer contenidos, que me parece demorará tiempo en ser desarrollada. Como ejemplo cuando buscas en Google ‘miserable failure’ te lleva a la página de George Bush, en lo que han denominado ‘google haking’, únicamente haciendo una campaña para que varias páginas enlacen a este sitio con esta frase. Es decir, se le puede sacar la vuelta a Google, pero ¿qué alternativa se tiene?

  • #008
    Enrique Dans - 21 julio 2004 - 01:18

    A ver, todos los que me leéis o habláis conmigo de forma habitual sabéis que adoro esa empresa. A lo mejor es como en las relaciones personales, cuanto más te implicas, más le exiges. Creo que el riesgo que está corriendo Google al posicionar su PageRank como moneda universal de medición de popularidad relevancia es enorme. El PageRank es, en este momento para una compañía, casi más importante que el precio de sus acciones («casi», he dicho «casi»… perdón para los financieros). La gente recorre kilómetros por un puntito más de Google Score. Es la indicación universal de tu relevancia, de tu importancia, de tu prestigio en la Red. Y sin embargo, comete errores absolutamente infantiles. Comprobar que dos dominios apuntan a la misma página, que dos páginas con direcciones diferentes son exactamente la misma, es inmediato para Google. Es más, dada la tecnología que usa para mapear las páginas, basada en spiders, ya lo sabe. En algún momento, incluso dijeron que se penalizaban a efectos de PageRank aquellas «redes de páginas» con vínculos cruzados que pretendiesen simular relevancia.

    Google hace muchas cosas fantásticamente bien, y que la critique provoca respuestas que van desde lo meditado a lo emocional. Pero agarrarse a su PageRank, un algoritmo claramente necesitado de mejoras, como base de su éxito, me parece, hoy por hoy, irresponsable y absurdo.

    En breve, tendremos algunas demanda interpuesta por alguna compañía norteamericana contra Google por «degradar» su PageRank. Podemos decir lo que queramos de las demandas norteamericanas, pero…

  • #009
    Fran - 21 julio 2004 - 14:39

    Hola, coincido en que es un error por parte de google, pero somos nosotros los que le estamos dando importancia al pagerank.

    Si recibes un enlace de terra, recibes un enlace pagerank 8 en todos los casos. Aunque tengas varias páginas con el mismo contenido, con www, sin ellas, dominio viejo, etc, sólo 1 es mostrada por google. Por ejemplo si pongo «enriquedans» me sale la página con www. No sin ellas, ni el dominio viejo; a fin de cuentas es el resultado bueno y relevante, independientemente del pagerank asociadado a cada url exacta, el resultado final para los usuarios a la hora de realizar una búsqueda creo que es bastante bueno, sin que esta incosistencia del pagerank afecte de ninguna manera.

    Saludos. Fran

  • #010
    Dirson - 21 julio 2004 - 20:14

    Enrique: ya existió una demanda por ‘degradar’ el PR de una página:

    http://google.dirson.com/noticias.new/0004/

  • #011
    alvy - 22 julio 2004 - 11:09

    El error no es de Google, sino de los webmasters que tienen dos URLs distintas con el mismo contenido — una redirección mal hecha. Por desgracia ese error está muy extendido. No es difícil conseguir que al teclear «xyz.com» saltes automáticamente a «www.xyz.com» (o al revés) pero por desconocimiento o vaguería la gente no lo hace. Y los que lo hacen obtienen mejor PR, lógicamente ;-)

    Las www deberían desaparecer como propone no-www.org, pero me temo que es no sucederá.

  • #012
    Roberto A. - 22 julio 2004 - 17:05

    No es tan sencillo crear esa redirección. No todo el mundo tiene acceso a los Name Servers, configuración de Apache o un simple .htaccess.

  • #013
    Scila - 7 octubre 2005 - 10:11

    Creo que el tema es un poco más complicado. las 3w son realmente un subdominio del dominio que contratas que puede o no apuntar al mismo sitio que el dominio principal, otra cosa es que por tradición todo el mundo lo apunte al mismo sitio que el dominio. Y Google no puede considerar todos los subdominio con el mismo pagerank, muchos sitios ceden subdominios de la forma usuario.empresa.com .
    Otra cosa es que google hiciese la vista gorda con el subdominio www. y sumase los links que apuntan a dominio y subdominio www. pero supongo que ya lo habrán meditado y descartado (aunque nunca se sabe)

  • #014
    Enrique Dans - 7 octubre 2005 - 10:57

    Con los medios que conocemos actualmente, está claro. Eso no lo discuto (y por no discutirlo, algunos creen que no tengo ni idea de posicionamiento :-)). Lo que reprocho a los motores de búsqueda es que sobre esa ‘triste’ situación (el buscador es de una inteligencia profundamente limitada), no sean capaces de innovar y buscar formas de clasificar las cosas con respecto a la relevancia de su contenido, no de acuerdo a si tienen un subdominio con www, sin www o con múltiples direcciones.

  • #015
    aercilur - 7 octubre 2005 - 11:06

    Aupa Enrique,

    Vengo del feed de comentarios. ¿A que artículo corresponde esta conversación?

  • #016
    Enrique Dans - 7 octubre 2005 - 11:19

    Pues francamente, me encantaría encontrar la forma de saberlo… :lol: Yo he llegado igual que tú. Debe haber alguna manera de insertar el permalink o el título del comentario en el template de Haloscan, pero no lo acabo de conseguir…

  • #017
    Un observador imparcial - 29 diciembre 2005 - 23:10

    Todo esto me parece un poco pasado de rosca. Mira, para subir tu popularidad en Google, y en cualquier otro buscador, hay un sistema muy sencillo: que el contenido sea interesante y mucha gente lo lea. Se acabó. ¿Cómo es posible que haya gente que se dedique a especular (porque son todo especulaciones, no tenéis ni idea de lo que hace en realidad Google, y yo tampoco) con el único objetivo de que alguien que busca algo se lo encuentre el primero en Google?

    Ah, si por que así tenéis visitas. Ya, pero si el contenido no vale para nada , las visitas no vuelven. Fin de todos tus esfuerzos.

  • #018
    jose luis - 13 junio 2007 - 22:37

    el google ha canviado mucho en su algoritmo de pagerank con incorporaciones de hilltop y lsi para mejorar la calidad del enlace es asedigital lo sabemos y trabajamos siempre a la ultima

  • #019
    Javea Inmobiliaria - 7 agosto 2007 - 11:04

    Esta muy bien esto del pagerank pero es cierto? alguien sabe alguna pagina para enlazar la mia que tenga un pagerank importante? ya sabes mas de 5+

  • #020
    consultoria de nuevas tecnologias - 30 octubre 2007 - 15:25

    yo tb quiero un enlace de pr 5, jjejje .
    Para consegir un enlace de pr 5 o mas, lo que se hace un donativo a una pagina y ella te lo agradece con un link, porque comprar link esta prohibido segun el apartado de webmaster de google, donde los usuarios pueden denunciar, pero mira que sea del mismo campo no te vaya a pasar como los que linkava un periodico muy conocido que todos sus clientes(que hacen donativos) con la actualizacion del pr(29-10-07) han bajado.

Dejar un Comentario

Los comentarios están cerrados