Tendencias en Internet: un análisis de contenidos

trendsInteresante experimento de Gemma Ferreres sobre tendencias en Internet utilizando técnicas de análisis de contenidos sobre tres blogs con periodicidad diaria y temática tecnológica, concretamente Error500, Denken Über y éste, mediante la herramienta Textalyser. La idea es deducir temas de interés en Internet a partir del número de menciones de un término dado, una técnica que el en Instituto de Empresa utilizamos para hacer analítica de blogs corporativos y comparar los resultados obtenidos con la aspectos como la comunicación de la compañía, su misión o su publicidad.

Los resultados son curiosos. En este blog, las cinco palabras más utilizadas son, en ese orden, Google, Dell, empresa, Apple y Microsoft, lo que no coincide exactamente con el mapa de temas que tengo desarrollado a partir de mis tags de Technorati (cuestión lógica que me lleva a pensar si metodológicamente será más correcto o interesante analizar la repetición de términos en las entradas, o la frecuencia de las tags en las que el autor define su entrada), y la interpretación de Gemma está bastante bien llevada.

11 comentarios

  • #001
    kiki - 17 septiembre 2007 - 19:14

    Pues va a ser que la herramientita esa tiene razón…

  • #002
    jftamames - 17 septiembre 2007 - 21:05

    Esperab algo más cuando se habla de tendencias. Algo parecido a lo que Richard MacManus de Read/Write hizó el 5 de septiembre pasado.
    Si es por lo que «ahora» se esta usando más, tu misma lista tiene a MS como parte fundamental y eso no denota tendencia. Sino «monotemas» que, por otra parte, tienen que ser los rentables para un blog.
    En el análisis de Gemma se aprecian tres ideas que he encontrado en el análisis de Richard y que tiene que «colar» sin que aparezcan directamente relacionadas en los términos:
    1. TV, como tercera revolución tras la de la música y la prensa escrita.
    2. APIs y servicios, donde sólo se para en mencionar a Google.
    3. La personalización, que llama «People have the power» de forma indeterminada.
    Interesante estudio a pesar de ser sobre sólo lo que sucedio «ayer».

  • #003
    eMA - 17 septiembre 2007 - 21:47

    Hola Enrique. Un comentario sobre los tags en entornos de usuario «normal». Los tags tienen el problema de que los elige el autor/editor. Hay herramientas de gestión del conocimiento que los generan automáticamente. Esto no tiene sentido en un blog pequeño, pero en entornos grandes (un periódico, una intranet gubernamental con un millón de documentos) en los que numerosos autores generan contenido diariamente, diferentes personas resaltarán diferentes tags para contenidos semejantes. Es un problema semejante al de la clasificación por categorías. A menudo hay tags demasiado genéricos, y otras veces son excesivos y se desvirtúan. La solución que se aplica es un motor de búsqueda que localiza los conceptos clave, los relaciona con otros documentos que decide que son parecidos y sugiere una lista de tags… curiosamente, acierta más que el usuario promedio, ahorra trabajo y racionaliza los ejes de clasificación. Paradójicamente, una máquina puede decidir mejor de qué habla un documento que la propia persona que lo ha escrito.

  • #004
    jftamames - 18 septiembre 2007 - 01:06

    eMA
    ¿Y eso no es uno de los esfuerzos de la web semantica?

  • #005
    Emilio Rodriguez - 18 septiembre 2007 - 01:32

    Realmente me parece pretencioso y nada, nada riguroso pretender sacar tendencias en internet a partir de 3 blogs. Por muy meritorios que estos sean, No os mireis tanto el ombligo por favor.

  • #006
    eMA - 18 septiembre 2007 - 08:23

    jftamames: sí, pero la web semántica (me guío por lo que cuenta el artículo de wikipedia) es un conjunto de herramientas descriptivas que se anexa al contenido (si me permites simplificar). De esa manera es posible indicar el significado de un término. Las herramientas de generación de tags prescinden de esas metalenguajes y extraen los conceptos a pelo. Que conste que la herramienta no entiende el documento ni sus conceptos; simplemente es capaz de indicar los términos y conceptos que se emplean, y su relación con otros documentos de su entorno.

    Es un acercamiento distinto, aparentemente más caótico, pues el único control que tiene el editor para los tags es… escribir bien. Por supuesto, se completa con una mínima intervención humana, pero lo interesante es la participación de la máquina.

  • #007
    Supremio - 18 septiembre 2007 - 09:33

    «Hecha con el teléfono en un sitio donde ayer me quitaron la cámara porque no se podía hacer fotos (o sea, que la hice POR FASTIDIAR :-)»

    y despues lloras cuando vienen los trollsa tu blog y babean. Acto seguido, nos haces creer que la gente que FASTIDIA es una enferma o una tarada… pues nada, bienvenido al club!

  • #008
    Supremio - 18 septiembre 2007 - 09:36

    Totalmente de acuerdo con Emilio…

    mucho pretencioso anda suelto por este blog

  • #009
    Eduardo - 18 septiembre 2007 - 10:55

    Ahora entiendo lo de tu artículo en Libertad Digital sobre los artistas; que se lo digan a la revista Quimera por «la horda de Gestores» y la demanda de la SGAE.

    Por qué solo se reparten el canon los artistas y la SGAE (MÁS DE 750.000 € de beneficio neto en 2006)

    Yo como persona que puede salir en cualquier foto y estar almacenado en el disco duro,tarjeta de memoria, CD, DVD y soporte que se nos ocurra, quiero mi parte del canon y quiero que cada ciudadano, sea artista o no, tambien reciba su parte. Al fin y al cabo tienen nuestros derechos de autor sobre nuestra imagen sin nuestro permiso.

    Salu2

  • #010
    jftamames - 20 septiembre 2007 - 19:46

    eMa
    Entiendo. Por tanto el caos del que hablas es debido a lo que cada uno entendemos a la hora de poner un tag a un tema y que la maquina ordena ese caos al extraer con más exito el uso más común, ergo el uso más parecido a lo que realmente signitica. Muchas gracias por la aclaración.

  • #011
    eMA - 20 septiembre 2007 - 21:53

    jftamames:

    Eso es. El caos es aparente, y al principio la idea provoca resistencia: «¿una máquina me va a decir sobre qué he escrito?». Desde luego el sistema no es perfecto, pero digamos que su tasa de tags irrelevantes es menor que la de un grupo de editores amplio y que no está en contacto permanente.

Dejar un Comentario

Los comentarios están cerrados