Como bien sabéis los que me leéis a menudo, una de las cosas que más me fascinan de esto de tener un blog es la posibilidad de entablar conversaciones. En este caso, es una conversación con mi amigo JJ, que desde su Atalaya ha tenido a bien contestar una de mis columnas en Libertad Digital, y que creo que puede generar un ofrecer un diálogo interesante y al que sacarle mucha punta. Vamos allá…
Comencemos por la primera tesis: el hecho de que la red sea o no un sistema caótico. Posiblemente no me haya expresado bien en mi uso del efecto mariposa, pero en ningún momento quise poner a la red como ejemplo de sistema caótico. Es más, en el destacado se ve calaramente, afirmo que la red es “una catedral”, y las catedrales, de caóticas, suelen tener más bien poco. De acuerdo también en que sea un sistema complejo, pero siempre he pensado que su estructura, aunque compleja, se puede representar, seguir y entender. No, no es la red lo que es caótico. Lo que es caótico es lo que están haciendo con ella a la hora de intentar evaluarla. Eso sí es caótico, y sí está lleno de mariposas que baten alas. Lo que se nos puede escapar no es la estructura de la red, sino el hecho de que en un sitio ocurra algo, se diga algo, y no nos enteremos porque las medidas que toma la gente, más que aleatorias, son estúpidas y carentes de sentido… son caóticas.
Y esto nos lleva a la segunda parte, en la que difiero muchísimo más: el sacrosanto pagerank. Dice JJ que “Si un sitio tiene más enlaces entrantes, tiene más pagerank”. Mentira. Mentira absoluta y falsedad documentable. Sin ánimo de llevar el tema a mi caso personal (lo hago porque es un caso que conozco bien y tengo controlado), esta página que estás leyendo en este momento tiene un pagerank de 6. ¿Se debe eso a que tiene, según Technorati, 173 vínculos de 138 fuentes? Puede ser, pero eso es, en primer lugar, otra mentira. Primero, porque la página, al tener ya no dos URL, sino cuatro, tiene en realidad muchos más vínculos entrantes, y un PR que parece un maldito tiovivo. Veamos:
http://edans.blogspot.com = PR 6 (379 vínculos de 264 sitios)
http://www.edans.blogspot.com = PR 2 (379 vínculos de 264 sitios)
http://www.enriquedans.com = PR 6 (173 vínculos de 138 sitios)
http://enriquedans.com = PR 4 (173 vínculos de 138 sitios)
Es decir, en puridad, y dado que quien vincula a una dirección no lo hace a la otra, esos conjuntos de vínculos deberían ser puramente aditivos, y resultar en 552 vínculos de 402 fuentes. Pero eso no lo refleja el “sacrosanto pagerank”, ni Technorati, ni ninguno de los rankings que utilice esas medidas sin depurar. En el caso de Technorati, por lo menos, podemos ver el error y corregirlo. En el caso de la oscurantista Google y su sacrosanto pagerank, ni eso. Es secreto de estado.
Por llevarlo a tu caso, tu misma página, Atalaya, tiene un PR de 6 si tecleamos su dirección normal, http://atalaya.blogalia.com/, pero un mísero 2 si le ponemos una tripleta de W delante, así, http://www.atalaya.blogalia.com/, diferencia que debería ser nula porque ES LA MISMA PÁGINA. No es como mi caso, con una URL adjudicada por Blogger y otra más mnemotécnica, más fácil de recordar… se trata exactamente de la misma página. ¿Por qué semejante diferencia en el pagerank entonces? Muy sencillo: porque el pagerank no es sacrosanto. Es, simplemente, una mala métrica. Una medida mal hecha, con errores groseros e inaceptables para la importancia que se le da. Lo dije hace muchísimo tiempo en este post, “La insoportable levedad del pagerank“, y la situación no ha cambiado desde entonces. El pagerank era una mala métrica hace un año y lo sigue siendo ahora.
Y por tanto, el hecho de que cuando alguien quiera poner un enlace a algún artículo sobre el futuro de la industria discográfica, sea más probable que enlace a PJorge, a ti o a mí acabe haciéndolo a uno en lugar de al otro, sólo demuestra una cosa: que si sigue sólo el criterio de la posición en Google para decidir una cosa así, es que es un descerebrado. Y seguramente tomará una decisión errónea, porque en realidad si lo hace así, la estará tomando al azar. Tendrá que vincular aquel con el que esté más de acuerdo, el que conozca mejor, el que le caiga más simpático, el que sea de su tierra o de su equipo de fútbol. No el que un motor de búsqueda con un criterio menos fiable que una escopeta de feria ponga por delante en función de los enlaces que “cree” que esa página tiene, mezclado con lo “bien programada que está”, y sazonado con vete tú a saber qué ingredientes secretos que encima se niegan a contar a nadie. Si me dices que a más vínculos, más pagerank, mi página tendría que estar encima de la tuya, porque Technorati dice que tienes 447 vínculos de 296 sitios, y eso es menos que los 552 vínculos de 402 sitios que suma la mía (una sola página, no lo olvidemos). Lo cual me trae sin cuidado y no me causa ninguna preocupación, porque seguimos hablando, simplemente, de medidas mal tomadas. De métricas torcidas. De algoritmos que se definen con cinco letras: M, A, L, O y S. De criterios que todos hemos dado por buenos porque en un momento dado eran los menos malos que había, pero eso no los convierte ni mucho menos en infalibles.
También, por cierto, difiero en lo del CSS: ¿qué es eso de que yo tengo que ponérselo fácil a la máquina para que me mida bien??? Ni de coña… que la máquina se las arregle para medirme bien esté yo quietecito, dando saltos o haciendo el pino. Y si no, es que la máquina es mala. A ver si ahora va a resultar que la máquina manda más que yo y soy yo el que tengo que adaptarme a ella… ¿en qué extraño altar dorado ha puesto el mundo a Google, que ahora resulta que las normas, en vez de marcarlas las personas, las marca Google? Me resulta patético ver a todo el mundo optimizándose para salir guapo delante de ese pedazo de miope llamado Google, y ver que haciendo determinadas operaciones se pueden ganar varios puntos de pagerank, ¡¡con el mismo contenido en la página!!
El problema no es el tener dos direcciones. El problema es que los algoritmos que muchos creen infalibles, no lo son para nada. Que el que una página aparezca más arriba o más abajo en Google tiene algo de ciencia, y mucho, muchísimo, de suerte, de caos, de efecto mariposa. Que los enlaces que Technorati afirma que tenemos no son los que realmente tenemos, sino los que Technorati DICE que tenemos. Hay muchos enlaces que no cuenta, y muchos que cuenta dos o tres veces. Comprobadlo. Ojo, tiene su mérito, adoro tanto a Google como a Technorati porque intentan hacer lo mejor posible una tarea de una enorme complejidad. Pero el que lo intenten no quiere decir, para nada, que lo consigan. Solo lo intentan. Y eso puede ser suficiente para que ganen mucho dinero, pero no para que nos arriesguemos a tomar según que decisiones basándonos nada más que en sus intentos.
Al final, termino como terminaba el post de hace un año: La contabilidad de Enron es más fiable que todas esas medidas. Al menos, con la contabilidad de Enron siempre sabíamos que se equivocaba en el mismo sentido.






05.08.2005 a las 07:13 Permalink
[...] "Criterios que todo el mundo aparentemente da por buenos, como el sacrosanto PageRank de Google, la cuenta de vínculos entrantes a una página web que lleva a cabo Technorati o los rankings de popularidad de Alexa son medidas completamente burdas, gros… [...]
05.08.2005 a las 08:29 Permalink
[...] Y es ahí donde entra en juego la discusión que mantienen Enrique Dans y JJ en torno a qué variables son realmente válidas a la hora de determinar la influencia, popularidad o presencia de una bitácora. Enrique está convencido de que los sistemas que ac… [...]
05.08.2005 a las 10:27 Permalink
[...] A partir de un artículo de Enrique Dans en LibertadDigital se ha desatado una interesante discusión en Atalaya, respondida por el aludido en su blog. Otras interesantes aportaciones aquí y aquí. La discusión se centra… [...]