Los límites de las folksonomías

La verdad es que me llamó la atención el cambio de diseño de 11870.com, uno de los sitios españoles que sigo con atención, pero no tanto por el cambio en sí, sino por lo que tiene detrás: la confesión de que el sistema basado en folksonomías no era adecuado, y resultaba necesario suplementarlo con una categorización del contenido. En su explicación del tema, Jesús Encinar venía a decir que «2.500 años de historia de las bibliotecas no están equivocadas», que «una categorización de los contenidos es necesaria». Según la experiencia de 11870, la folksonomía era una gran ayuda para el buscador, pero no ayudaba a evitar falsos positivos y falsos negativos en la generación de resultados.

¿Supone esta experiencia un descrédito para el desarrollo de las folksonomías o etiquetado colaborativo, uno de los bastiones sobre los que se apoya la llamada Web 2.0 para el manejo de los contenidos? Según la teoría, las folksonomías resultan ideales para clasificaciones inceptivas, que parten de contenidos aportados por los usuarios, en un esquema en el que resultaría difícil obtener una productividad similar proveniente de fuentes estructuradas. Los problemas surgen por inconsistencia: un origen diverso condiciona criterios diferentes en la asignación de etiquetas, lo que en ocasiones acaba derivando en inconsistencias, sinonimias, homonimias, polisemias o, en general, la falta de homogeneidad y de coherencia.

El balance, por tanto, está entre el aporte de contenidos y el orden de los mismos: sistemas de aporte de contenidos estructurados, procedentes de una o pocas fuentes, y clasificados por expertos frente a sistemas en los que muchas fuentes independientes aportan contenidos de manera no estructurada. Si busco fotos en Flickr partiendo de una palabra clave determinada, encontraré sin duda lo que busco, pero rodeado de un cierto nivel de ruido correspondiente a las ocasiones en que un usuario ha utilizado ese mismo término con un criterio diferente al mío. El balance es el que es, no se puede tener lo mejor de los dos mundos: si se aspira a tener un catálogo de contenidos impóluto y sin falsos positivos o negativos, no se puede optar por la categorización exclusiva por los usuarios. Si se espera obtener un catálogo grande con un coste bajo, no se puede depender únicamente del aporte estructurado. Es lo que hay. Para buscar soluciones de compromiso, están el conjunto de soluciones en el que se inscribe la que ha tomado 11870: soluciones mixtas en las que una taxonomía se superpone a una folksonomía. En la práctica, ni más ni menos que una folksonomía en la que determinadas etiquetas están estructuradas por expertos y reservadas para un uso determinado. Una folksonomía con determinados vocabularios controlados. ¿Contradice eso de alguna manera el espíritu de la Web 2.0? En absoluto, ni para el más purista. Simplemente, opta por suponer un margen de paciencia determinado a sus usuarios – los servicios de directorio no son únicos ni están sujetos a importantes barreras de salida – y por intentar evitar un número elevado de resultado erróneos que hagan que éstos decidan acudir a un servicio similar de la competencia. Si 11870 aspira a convertirse en «el directorio generado por los usuarios», parece razonable que determinadas etiquetas – las más genéricas o las utilizadas como primer filtro de manera más habitual – estén reservadas y categorizadas de una manera más rígida que otras, para asegurar un uso adecuado de las mismas. Reservar determinadas etiquetas y categorizarlas no hace que 11870 se parezca a una biblioteca, simplemente fija unos criterios determinados y mantiene la libertad de los usuarios para todas las demás. Después de todo, lo que un usuario busca en 11870 y lo que podría determinar una hipotética ventaja competitiva de este servicio de directorio no es la lbertad de asignación de las categorías principales de búsqueda, sino prácticamente «todo lo demás»: las evaluaciones, las opiniones, las calificaciones, las fotos, etc. Desde mi punto de vista, una decisión que para nada traiciona la idea original, y que seguramente aporte mucho valor.

#001
Jesus Encinar - 25 diciembre 2008 - 22:32
Enrique, super interesante el post y muy acertada toda la reflexión!
Por explicar el cambio un poco más con un ejemplo. Si buscas en 11870 «japoneses en madrid» te salen 172 resultados, de ellos 71 son restaurantes japoneses en la ciudad de Madrid. Los demás pueden ser muchas cosas… japoneses en Madrid provincia o cualquier provincia de España con una «calle Madrid», tiendas para japoneses o sencillamente que alguien haya dicho en un comentario que prefiere los japoneses al codillo. Todos esos resultados para el buscador son validos si sólo busca textos con los keywords «japoneses» y «madrid». El caso extremo sería Google que te ofrece 1.270.000 páginas para la misma búsqueda. Pero si estás utilizando 11870.com para localizar los japoneses nuevos, los que recomiendan tus amigos o sencillamente verlos sobre un mapa… 1.270.000 paginas no te sirven. Necesitas una pagina directa tipo esto:
http://11870.com/c/restaurantes/japoneses/es/es/madrid
El hecho de que las folksonomías no sean la panacea para resolver todos los problemas no significa que no sean útiles. Todo lo contrario! Las etiquetas de los usuarios y la clasificación que cada usuario hace de los sitios en su propia ficha es super útil para mostrar resultados en el buscador a quién busca algo genérico.
Para mi la principal lección es que las estrategias mixtas, eclécticas, mestizas, son la mejor solución para dar una solución al usuario. No se trata de restar o enfrentar soluciones sino de saber qué sirve para qué y utilizar la mejor combinación para dar un buen resultado. De nada sirve una discusión categórica y de máximos de «categorías» contra «folksonomías».
#002
Xavier Belanche - 25 diciembre 2008 - 22:52
En el ámbito del sistema educativo se ha optado siempre por sistemas de catalogación de recursos basados en taxonomías cerradas. Ejemplos de lo que digo son Merlí, servicio del Departament d’Educació de Catalunya, o Agrega. Los dos comparten la misma visión de clasificar y gestionar los contenidos en base a una conjunto finito de categorías establecidos siguiendo los criterios definidos primero en el LOM y más adelante en MELT. Este sistema presenta un problema: la clasificación pasas por el filtro de un grupo de especialistas encargadas de etiquetar cada uno de los recursos. Es un trabajo lento pero evita el ruido, la sinonimia o los falsos positivos de las folksonomías. En cambio, la implicación por parte del resto del colectivo, en este caso, de los docentes, es escasa debido a la falta absoluta de participación. De hecho, si vemos el número más alto de visitas de los recursos en el caso de Merlí en los últimos 30 días, no supera la centena. Muy pobre si hablamos de un colectivo de alrededor de 50.000 docentes en toda Catalunya.
Personalmente me inclino siempre por un modelo descentralizado y horizontal de la clasificación de la información. Es cierto que este sistema genera un ruido molesto, pero es este ruido que puede llevarme a descubrir contenidos que, de la otra manera obtendría el fatídico 0 results, mensaje que los servicios que han nacido bajo el paraguas de la Web 2.0 han sabido muy acertádamente evitar. En cualquier caso, yo apostaría por un modelo de folksonmía más próximo a Twine, donde los propios usuarios agrupan los contenidos según un tópico o colector pero sin dejar de lado la práctica del tagging. Aún así no me parece equivocada la opción de 11870. Esperemos que les funcione bien :-)
#003
Daniel - 25 diciembre 2008 - 23:03
Por una vez, estoy 100% de acuerdo contigo Enrique. No cabe duda de que las categorizaciones colaborativas son tremendamente útiles y, en muchos casos, pueden funcionar por si mismas sin ningún tipo de problema, pero hay que ser capaz de ver cuando no son suficientes o simplemente no son útiles.
En realidad, siempre he pensado que el germen de un proyecto colaborativo como 11870 no podía ser únicamente la comunidad, que necesitaba una base, una malla sobre la que construir una red sólida. Creo que es un acierto y por mi parte, voy a darles una segunda oportunidad, que se la merecen.
#004
Arturo - 26 diciembre 2008 - 00:45
Lo que creo que se perdió hace tiempo es el poder coger una ciudad entera y rastrear todo lo que tiene en ella. Ya que no sólo la gente se rige por un sitio sino por áreas geográficas
#005
Miguel Rebollo - 26 diciembre 2008 - 08:56
A mi me gusta mucho lo que hace delicious.com sin renunciar a la categorización de los usuarios. Lo que ellos hacen es sugerir etiquetas para las entradas (delicious es un sistema de marcadores -bookmarks- social). Claro que ellos juegan con ventaja, porque es fácil que varios usuarios hayan marcado y esa misma página antes.
Sin emargo, al principio en 11870 lo usual es decubrir sitios nuevos, por lo que esa primera sugerencia es muy difícil. Es el eterno problema de los sistemas de recomendación: el arranque en frío; cómo recomendar contenidos (etiquetas en este caso) cuando no hay información suficiente del usuario o del elemento en cuestión.
#006
dreig - 26 diciembre 2008 - 09:38
Tu reflexión, Enrique, muy acertada a partir del análisis de 11870, es parecida a la que vengo haciéndome desde hace unos días, cuando los participantes en un taller me hicieron ver el poco sentido de ser estrictos, puristas en ciertos ámbitos de la web, como el de su organización. Creo que se deben respetar unos principios mínimos (no abandonar el enfoque folcsonómico) para poder ser catalogado de aplicación de la web social, pero ser demasiado estricto lleva, en este caso, al absurdo y por tanto al abandono de lo princiipal: el servicio que la aplicación es capaz de ofrecer al usuario.
Pasa algo muy parecido en el ámbito en el que inicié mi reflexión, el de la web semántica: es conveniente que cualquier aplicación, para poder ser considerada semántica, respecte unos mínimos de marcado, de aporte de metadatos al html plano, pero si hacemos del uso estricto de RDF condición necesaria, nos quedamos sin aplicaciones (el mismo Twine que señalaban más arriba combina RDF con otras tecnologías de inferencia). Empieza a surgir el término, más adecuado, más flexible, de web contextual. Quizás sean los estándares los que deberían adaptarse a la realidad y no a la inversa si, otra vez, queremos respetar la idea original: la relevancia de los resultados.
Saludos
#007
Dubitador - 26 diciembre 2008 - 12:05
Por lo leido en el post y los comentarios diriase que el etiquetado social bien puede tomarse como base para el etiquetado o clasificacion profesional; o tambien, la labor profesional puede limitarse a pulir lo producido mediante etiquetado social, eliminando o limando redundancias, inconsistencias o incluso envenenamiento de datos.
#008
fahrenheit 1C3 - 26 diciembre 2008 - 15:21
offtopic
Menuda campaña de marketing viral…
http://www.publico.es/televisionygente/186223/primer/anuncio/ano/publicitario/despensa
Patético.
Ya lo decía Platón… la democracia es el gobierno de los necios
#009
Alpino - 26 diciembre 2008 - 16:42
Perdón…alguien me puede decir donde podría ampliar conocimiento de todo esto?????
#010
Greg - 27 diciembre 2008 - 08:37
Folksonomía ~~vs.~~ y Taxonomía, el secreto del éxito o del fracaso que resulta de uno u otro sistema de clasificación de la información reside probablemente, como en la mayoría de las recetas con más de un ingrediente, en las proporciones y la metodología:
¿Qué «sistema» ha de predominar? la mano del que sabe clasificar además de cohesionar gracias a un criterio único o la del que genera y mejor conoce el contenido? Cuándo se ha de usar más bien uno u otro?
Quizás habría de diferenciar en 11870 el contenido creado del contenido aportado.
Me explico: un usuario no crea un restaurante sino que lo da de alta. En este caso, el etiquetado debería de correr a cargo del equipo de la web (taxonomía), apoyado por supuesto en las sugerencias iniciales del propio usuario.El contenido creado es el comentario, apreciación, valoración e incluso descripción – seguramente honesta pero siempre subjetiva – que realiza el usuario. En cuyo caso la folksonomia me parece lo único acertado.
Concretamente, eso significaría que las etiquetas «restaurante», «japonés», «Madrid» deberían de corren a cargo de 11870, mientras que tags como RCP (Relación Calidad Precio ;-) ), Buenos productos, Amabilidad,… son responsabilidad única del usuario.
No me preguntéis por la frontera entre lo descriptivo y lo apreciativo porque, como siempre, no existe tal frontera. Hay un limbo en el que son las apreciaciones personales la que hacen que se decante por uno u lo otro. Pero el limbo es minoría y los casos de etiquetas claramente descriptivas o apreciativas son mayoría.
#011
Antonio - 27 diciembre 2008 - 11:54
Hola a todos, me parece un debate muy interesante. ¿como consegir con un sistema de clasificación dar organizar el contenido de modo relevante a los usuarios? bueno, yo no me inclinaría ni por una categorización cerrada ni por dejar el asunto en manos de los usuarios, ambos me parecen sistemas que por recaer en la mano del hombre no pueden gestionar adecuadamente los grandes volúmenes de información de nuestra época. para mi el camino correcto sería:
1. extraer etiquetas potenciales de todo el conjunto de documentos
2. reducir la lista a aquellas que mejor puedan representar a todos los documentos
3. clusterizar para saber cuales son verdaderamente las categorías (no las que nadie dice que son)
4. determinar la proximidad de cada documento a cada una de las categorías. OJO que esto es muy importante, así ahora un documento ya no cae en una categoría sino que está próximo en mayor o menor medida a todas ellas
#012
Francisco Tosete - 27 diciembre 2008 - 13:52
@ Alpino,
puedes empezar por aquí:
http://www.thinkepi.net/tags-folksonomies-y-bibliotecas/
http://www.deakialli.com/2005/07/28/el-exito-de-las-folksonomias/
http://www.nosolousabilidad.com/articulos/indizacion_social.htm
Saludos
#013
Luis Sancho - 27 diciembre 2008 - 17:19
La verdad es que hace tiempo que mis socios y yo venimos discutiendo acerca de este tema para la organización y búsqueda de contenidos en nuestro portal, y siempre hemos tenido claro que ambos conceptos (categorización/taxonomía y folksonomía) deben coexistir de una manera controlada. La experiencia nos dice, como bien apuntan Jesús y Enrique, que los usuarios, a la hora de etiquetar sus contenidos, no siempre son todo lo precisos que nos gustaría ni tienen porque estar pensando en la misma acepción de una determinada palabra que nosotros, con lo que, a la hora de realizar una búsqueda por etiquetas, los resultados no terminan siendo lo precisos que nos gustaría.
Es obvio, por todo esto, que debería haber un grupo de administradores que se encarguen de mantener una categorización de los contenidos en un ámbito global y genérico que permita a los usuarios etiquetar sus contenidos en un ámbito más específico, si es posible ayudado mediante sugerencias. Por ejemplo: los administradores establecen la ciudad «Madrid», las categorías «restaurante» y, en un nivel inferior, «japonés», con lo que, a partir de ahí, es el usuario el que escribe etiquetas como «sushi», «amigos», etc. De esta forma, las búsquedas son infinitamente más eficientes, puediendo buscar por categoría, ciudad o etiqueta de una manera mucho más práctica y sin ruido innecesario.
#014
Alpino - 27 diciembre 2008 - 17:19
Gracias Francisco…. Todo esto tiene algo que ver con l web semántica??????