Entendiendo el sacrosanto algoritmo

Pocas empresas han hecho tanto por la difusión de la palabra «algoritmo» como Google. Sin embargo, cuando hace una semana un estudio etnográfico de la Illinois University reveló que los tan afamados «nativos digitales» eran muy malos a la hora de utilizar y sacar partido a los buscadores en la red, no me supuso ninguna sorpresa. Llevo muchos años dando clase a distintos niveles de directivos que van desde postgraduados hasta personas con experiencia directiva muy significativa, y me sigue llamando mucho la atención el profundísimo desconocimiento que existe acerca del funcionamiento de algo tan relevante hoy en día como un buscador. Comentarios superficiales suelen unirse a mitos de diversos tipos y a desinformaciones variadas procedentes de diversas fuentes (medios de comunicación, charlas de bar, supuestos SEOs que ofrecen «fórmulas magistrales», etc.) o falsas atribuciones con motivación más o menos histórica, en un cóctel de lo menos recomendable para quien intenta entender las reglas de un entorno que ya dista mucho de ser nuevo. Puedo dar fe de que el nivel de confusión y malas interpretaciones en este sentido es, a todos los niveles, elevadísimo.

A día de hoy, un buen posicionamiento en buscadores puede ser absolutamente fundamental para una compañía. En algunas industrias, puede significar el ser o no ser. Y sin embargo, no nos paramos a pensar qué es lo que realmente hace un buscador, cómo construye su base de datos ni cómo ordena los resultados de cada una de las consultas que los usuarios le plantean. Generalmente, empiezo una de mis sesiones intentando provocar el razonamiento de cómo puede desarrollarse de manera lógica una tarea así, para posteriormente centrarme en Google y tratar de señalar qué es lo que Larry y Sergey plantearon de manera diferente, de cuál fue esa supuesta «revelación» que les animó a plantar su respectivos doctorados para dedicarse a fundar la compañía: un algoritmo social (basado en las actuaciones de terceros que, al vincular desde sus páginas, determinaban una métrica, el PageRank, que era la base de la ordenación por relevancia) que alejaba el control de las manos de los responsables de las páginas. Un capítulo entero de mi libro está destinado a intentar transmitir el origen y el significado de este tipo de cuestiones, además de plantear temas de ámbito algo más estratégicos acerca de la evolución de Google como compañía.

Google publica hoy un vídeo, «Another look under the hood of search« en el que comenta cómo funciona el proceso por el cual modifican el algoritmo de búsqueda, un proceso que se desarrolla de manera contínua y que da lugar a más de quinientos cambios al año, un cambio cada 17.5 horas como media:

 

 

Una evolución constante que sigue manteniendo – y potenciando – los aspectos sociales (que la relevancia de una página esté fundamentalmente determinada por la reacción y valoración del entorno externo ante la misma), y que debe balancear un cierto nivel de transparencia con la posibilidad de que una visibilidad excesiva facilite excesivamente su manipulación. Los grandes cambios anunciados en el algoritmo, como Panda (sobre el que escribiré en los próximos días en cuanto termine de recopilar información de terceros, porque considero la mía no suficientemente relevante) o los anuncios de cambios planteados ocasionalmente por Matt Cutts, son solo una parte de la realidad de un proceso que evoluciona y busca constantemente la mejora continua.

Un algoritmo que, a día de hoy, es la norma fundamental que cualquier directivo o empresa tiene que entender para plantear su papel en la llamada «economía de la atención», y cuya comprensión, sin embargo, está notablemente por debajo de lo que cabría esperar para una tecnología con más de once años de antigüedad, ya no entre el llamado «gran público», sino entre los directivos de empresas que supuestamente desarrollan su actividad en el entorno que este algoritmo, en gran medida, determina.

21 comentarios

  • #001
    Rafa - 26 agosto 2011 - 11:36

    Hoy en día, PageRank no creo que suponga ni un 10% a la hora de ordenar los resultados de búsqueda para Google, que está usando otras métricas para determinar la calidad y originalidad de cada sitio. Y el anchor text sigue siendo fundamental. Lo prueba el hecho de que el Google Bombing sigue siendo efectivo

  • #002
    Pep - 26 agosto 2011 - 11:51

    «reveló que los tan afamados “nativos digitales” eran muy malos a la hora de utilizar y sacar partido a los buscadores en la red, no me supuso ninguna sorpresa. Llevo muchos años dando clase a distintos niveles de directivos que van desde postgraduados hasta personas con experiencia directiva muy significativa,»

    ¿Y esa gente son nativos digitales?

  • #003
    eljose - 26 agosto 2011 - 12:01

    Es verdad, ¿cuanta gente conoceis que use el + o – o las comillas para buscar?

  • #004
    José Carnoedo - 26 agosto 2011 - 12:02

    Por no hablar de que el 90% de la gente ni sabe que google va adaptando las búsquedas a su personalidad, hábitos, cultura, etc., y al final uno no sale de un círculo, que cada vez es más pequeño. Así, la gente me pregunta que cómo soy capaz de encontrar a la primera cosas que a ellos no les salen, o que no son capaces de bajarse el utorrent gratis. Hint: desactivar la web history. Y otra cosa: la internet en español es prácticamente una ‘demo’ de la anglosajona. Los contenidos son peores y muchísimo más escasos.

  • #005
    JM Vanjav - 26 agosto 2011 - 12:07

    No creo que la formula sea sencilla y, en algunos casos, el resultado de la búsqueda es absurdo. Pero, para las cosas habituales y las no tanto, la diferencia entre Google y la competencia es abismal. Es como si estuviera vivo y evolucionara sobre si mismo, por eso se mantiene en cabeza y es el referente de las búsquedas por Internet. El volumen tan impresionante de datos que maneja, a mi modo de ver, puede tener su lado obscuro según se filtre y utilice la información.

  • #006
    Enrique Dans - 26 agosto 2011 - 12:21

    #002: Los de los Masters in Management son postgraduados recientes, y se van acercando mucho al perfil de nativos digitales. De hecho, el efecto se nota mucho desde el punto de vista del profesor. Obviamente, los del Senior Management Program no, lo comento porque es una muy mala noticia que personas con una amplia experiencia directiva y responsabilidades generalmente importantes estén perdidos en un tema tan relevante como este.

  • #007
    Rafa - 26 agosto 2011 - 13:07

    » un algoritmo social (basado en las actuaciones de terceros que, al vincular desde sus páginas, determinaban una métrica, el PageRank, que era la base de la ordenación por relevancia) que alejaba el control de las manos de los responsables de las páginas»

    Puede que fuera así al principio (estamos hablando de 1998), pero hoy en día precisamente la relevancia está más que nunca en manos de los responsables de las páginas. Está más que demostrado que con la estructura actual de la Web, es sencillo conseguir que tu sitio sea altamente referenciado. De hecho uno de los cambios importantes y recientes de Google ha sido penalizar las Link Farms

  • #008
    Gorki - 26 agosto 2011 - 14:29

    Hoy las labores de SEO se complican muchísimo porque cada vez tiene más peso en el orden que da a los contenidos, las circunstancias personales de quien hace la consulta, localización geográficaa, historial previo de consultas, etc., por tanto el encargado del SEO nunca sabe si su página se posiciona bien de forma general, y menos aun entre el target que a él específicamente le interesa.

    Mi experiencia personal, es que si haces buenos contenidos, Google te manda más gente, por tanto Google funciona bien aunque no sepamos como lo hace y por otra parte, como usuario, he visto que últimamente Google se ha deshecho de aquellas páginas que antes te aparecía en los primeros lugares y no eran relevantes, sino puro trabajo SEO

    Sigo sin saber como funciona Google, y para mi, la mayor crítica que le puedo hacer es que Google valora popularidad y no calidad, y que si se les va la mano en la personalización al final, te va a prohibir el paso a horizontes más amplios del que ya tienes, pero yo quise pasarme a BING cuando Google censuró páginas a modo de castigo y he vuelto a usar Google. por que no hay color en las respuestas de uno y de otro.

  • #009
    Ismael El-Qudsi - 26 agosto 2011 - 14:29

    Lo que es increible es que las empresas grandes «gasten» millones de euros en Adwords (en España)y no «inviertan» en mejorar su SEO.

    Cuando dejas de pagar los Adwords, Google cierra el grifo y tu trafico cae, pero como al director de marketing o publicidad le pagan por conseguir objetivos anuales no importa… :)

  • #010
    julian parla perez - 26 agosto 2011 - 14:41

    Rizando el rizo. En la Tablet de Samsung busco en google por la voz, y si he conseguido vocalizar bien, es un éxito. Ahora bien, aquí no hay signos que valgan y desconozco cómo los algoritmos se adecúan a la fonética.

  • #011
    Francisco javier Garcia Orts - 26 agosto 2011 - 15:18

    Un post muy interesante.
    Totalmente de acuerdo en la importancia de conocer el algoritmo.
    Considero muy dificil conocerlo con todas sus variables, sin embargo creo que entendiendo la filosofía de google se conoce el «core» del algoritmo y se puede predecir potenciales evoluciones.
    Un saludo
    Francisco Javier Garcia Orts

  • #012
    anonimio - 26 agosto 2011 - 18:21

    Tal vez, para no llegar a morir de éxito los de Google deberán tener en cuenta el Principio de Peter. Y por lo menos en dos sentidos. Por una parte, no ascender a sus mejores expertos hasta su nivel de incompetencia… Y por otra, no hacer lo mismo con el propio buscador. Es decir, ir «mejorándolo» sin solución de continuidad hasta que deje de resultar útil.

    http://manuelgross.bligoo.com/content/view/349754/El-Principio-de-Peter-Incompetencia-e-Infelicidad.html

  • #013
    Jose - 26 agosto 2011 - 20:41

    Enrique,

    off topic y de los gordos: en cualquier libro serio de ensamblador, C o Pascal de los años 70/80, se describe el origen del término algoritmo y me ha sorprendido ver una entrada tan paupérrima en la RAE, sobre todo por el comienzo «Quizá del lat. tardío…». Si a estas alturas aún no tienen claro de dónde procede el término, mal vamos.

    Sería más enriquecedor para el post que lo cambiaras por este otro que si es correcto Algoritmo

  • #014
    Juan Luis Mora - 27 agosto 2011 - 00:31

    Quizás lo mejor seria decir: muy buen articulo bla bla bla… Para dejar un bonito link en este blog tan «relevante»…. Pero no voy a contenerme.

    En primer lugar: ¿Dónde se explica el más mínimo detalle de algoritmo en este artículo, salvando la parte del page rank?

    En segundo lugar: ¿Por qué tienen los usuarios que saber hacer complejas búsquedas? Yo creo que es el buscador el que tiene que entender al usuario y no lo contrario.

  • #015
    Ela - 27 agosto 2011 - 12:56

    @ Juan Luis Mora y las navajas suizas tienen que saber lo que quiere el usuario y sacar ellas solas el abrelatas. ^__^ Google ya hace un buen trabajo de intentar adivinar lo que quieres, pero lo suyo es saber manejar las herramientas que te dan.

  • #016
    Mario - 27 agosto 2011 - 16:34

    #014. El nivel de análisis y detalle que pides o es secreto industrial o está protegido con patentes.

    No olvides que Google usualmente se caga en la propiedad intelectual ajena ya que la «información quiere ser libre» salvo claro, cuando se trata de la propiedad intelectual o la información del propio Google. Esta sí que no quiere ser libre.

    De tal manera que, inclusive en el supuesto negado que Enrique contase con este tipo de datos de «insider», mal haría en hacerlos públicos sin exponerse a algún tipo de denuncia judicial.

    #08.El «oscurantismo» de Google sobre cómo hace lo que hace es proverbial y no sólo se debe a la protección de su propiedad industrial (objetivo totalmente legítimo), sino también, y esto es lo feo, al uso y abuso de nuestra información personal, privada y hasta íntima, cuando utilizamos sus servicios. Y no estoy hablando de que utilize nuestro propio historial de búsquedas para refinar sus resultados sino que cuando yo envío un Gmail a mi mujer, supuestamente privado, que contiene la frase «voy a comprarte la licuadora nueva», aparezcan en mi próxima búsqueda sobre noticias políticas adsenses de Oster y Phlilips.

    Claro, algunos pueden sentirse felices con esta situación o que más da, hacerse los idiotas pensando que Google hace magia, pero deberían autoreferirse en adelante no como «usuarios» de Google sino como «usados» por Google.

  • #017
    Jeibros - 27 agosto 2011 - 22:33

    Como consulta: cómo va realmente el algoritmo? En clases de Métodos Numéricos en la carrera creo que nos mencionaron que se basaba sobre el sistema de vectores propios, pero ahí lo dejó. Iba bien encaminado?

  • #018
    Carlos economistaingles - 28 agosto 2011 - 12:17

    Estoy totalmente en desacuerdo con el uso del término «algoritmo». Son las ecuaciones, formulas y funciones de toda la vida, las que estudiábamos en el colegio. También podemos hablar de programa, código, lógica…

    ——————————————————-

    El modelo organizativo de Empresa es imperfecto. es el del «me too». ¿Para qué se van a preocupar las empresas de hacer las cosas bien? ¿Qué tiene que ver hacer las cosas bien con ganar dinero?

    ——————————————————

    ¿Conocen la fabula de la rana y el escorpión?

    El escorpión quiere cruzar el rio y convence a la rana para que le lleve. A mitad de camino le clava el aguijón y la rana exclama «¡Escorpión, que has hecho! ¿no ves que ahora nos ahogamos los dos?» Y el escorpión responde «Lo siento Rana, es mi naturaleza.»

    Una cosa es respetar a los escorpiones, y otra pensar que son nuestros amigos. Esta crisis pasara y se volverá a repetir hasta que o bien los Escorpiones no tengan aguijón o las ranas no sean tan ilusas.

  • #019
    Oscar Trabazos - 28 agosto 2011 - 12:28

    Bien explicado! En nuestro caso, hace años que trabajamos con algoritmos propios que no dejan de mejorarse año tras año. Uno de los problemas que nos encontramos es en la incapacidad de muchos de entender que estos son un alto valor de la compañia. Cuando hablas con posibles inversores sobre Inteligencia artificial y algoritmos no nos entienden y al final solo vale tu estrategia de ventas.

    Oscar Trabazos
    CEO anpro21

  • #020
    SubSonica - 31 agosto 2011 - 09:35

    Enrique: Si quieres que tus alumnos vean de primera mano un ejemplo cómo funciona un buscador, «tocándolo» y no solo mediante ideas más o menos abstractas, «de oidas» ó imaginándose cómo funciona un motor de búsquedas como google, te recomiendo que hagais en clase una instalación de YACY, un buscador libre y distribuido (con resultados en «peering» ó al estilo «Folding at home»), que te permite gestionar un motor de búsqueda tanto de forma local como en la red, montar un cluster de buscadores para indexar documentos en una empresa, etc…

    http://www.yacy.net/es/

    Como dicen en su página: «Imagina si, en vez de depender de un propietario de software de un gran motor motor de busqueda profesional, tu motor de busqueda fuera operado por muchas computadoras que no estan bajo el control de ninguna compañia o persona.»
    Pero es que además tiene otras implicaciones/ventajas:

    «YaCy distribuye su índice a todos los participantes, lo cual permite construir un motor de búsqueda independiente.

    Una búsqueda anónima y sin nungún tipo de censura solamente es posible a través de tu propia instalación de YaCy»

  • #021
    Carlos Hernandez Guarch - 31 agosto 2011 - 12:18

    Lamentablemente ( o no) los resultados de Google cada vez son más débiles a la hora de buscar información con algún tipo de interés comercial. P. ej si se busca servicio tecnico oficial [marca] + [ciudad] aparecen un sinfin de enlaces de servicios no oficiales que ñaaden, sin serlo, el servicio oficial.

    Ello no es tan solo responsabilidad de Google sino de las propias empresas que no tienen en consideración a sus clientes.

    Otro ejemplo, si se busca información acerca de un determinado producto son muchos los enlaces que derivan a paginas en la que el termino buscado no se encuentra en la web o si se encuentra es tan solo a efectos de posicionamiento.

Dejar un Comentario

Los comentarios están cerrados