Facebook se destaca frente a Google en la lucha contra las noticias falsas

Facebook pone en marcha su mecanismo para etiquetar las noticias disputadas como tales, a partir de la comparación de repositorios de fact checking como Snopes, PolitiFact u otros que acepten una serie de principios de funcionamiento. El movimiento de Facebook coincide precisamente con el momento en que Google empieza a recibir fuertes críticas debido a los snippets con los que responde a determinadas búsquedas, en los que aparentemente no llevan a cabo ni el más mínimo y elemental proceso de comprobación, y recurre a fuentes de credibilidad nula o a sitios con visiones intensamente partidistas, tratándolos como fuentes de información supuestamente fiable y considerándolos como respuestas válidas.

El mecanismo empleado por Facebook parece claro: recurrir a una serie de fuentes contrastadas para una comparación de hechos y un etiquetado en consecuencia. En su contra, la posibilidad de que el mecanismo no sea suficientemente rápido, y que para el momento en que los equipos de fact checking hayan podido llevar a cabo sus comprobaciones con rigor, la difusión ya se haya llevado a cabo y el daño, en gran medida, ya esté hecho. A su favor, la posibilidad de complementar esos mecanismos con evaluaciones de los usuarios, la idea de emplear ese proceso para designar la calidad y fiabilidad de los sitios en función del número de veces que las noticias que publican son disputadas (lo que se convertiría, eventualmente, en un desincentivo a su publicación), y la progresiva mejora de los algoritmos de machine learning que puedan aprender a etiquetar esas noticias no tanto en términos de la noticia en sí, sino de sus patrones de difusión, siguiendo mecanismos similares a los empleados en la detección de patrones de fraude.

En el caso de Google, el problema fundamental parece partir precisamente de la no aplicación de ningún tipo de inteligencia: los snippets que el buscador destaca en respuesta a ciertas búsquedas parecen provenir directamente de algún tipo de ranking de popularidad, y en consecuencia, tender a destacar precisamente sitios de carácter sensacionalista o intensamente polarizado. Los ejemplos no dejan lugar a dudas: que el buscador destaque de manera prominente teorías conspiranoicas ante búsquedas como «planea Obama un golpe de estado», o destaque respuestas planteadas como broma por Monty Python como si fueran una verdadera explicación de por qué razón los coches de bomberos son rojos es algo que deja a la compañía en muy mal lugar, sobre todo después de que su director general, Sundar Pichai, destacase en repetidas ocasiones que «su inteligencia artificial estaba por encima de la inteligencia artificial de sus competidores«.

En el caso de Google, el problema se ha acentuado con el lanzamiento de su asistente conversacional, Google Home: lógicamente, el planteamiento de un asistente conversacional no puede ser el de leer uno detrás de otros los diez resultados de una página de resultados o SERP (Search Engine Results Page), sino que tiene que escoger una de ellas para devolverla mediante su interfaz de voz. En este caso, dado que el aparato escoge sistemáticamente la respuesta destacada por Google en su snippet y el mecanismo por el que se obtiene ese snippet carece de la inteligencia suficiente para discernir cuándo un resultado proviene de un sitio fiable o de una página absurdamente tendenciosa, el resultado es, en muchas ocasiones, que formulas una pregunta a tu Google Home y este te responde con la conspiranoia o la barbaridad de turno, comprometiendo completamente la credibilidad de la compañía y de su tecnología – más aún teniendo en cuenta que los usuarios de Google Home pueden ser considerados dentro del segmento de los denominados early adopters y, por tanto, muy susceptibles de identificar (y de ofenderse) con este tipo de respuestas.

Que Google, compañía con dieciocho años de experiencia en la búsqueda, caiga en un error tan de base como que sus resultados no estén a la altura como para ser leídos por una máquina y suministrados como respuesta única a una pregunta, debería llevarnos a pensar en la dificultad intrínseca de este tipo de cuestiones, y en el problema de credibilidad que puede llegar a representar si no se corrige de manera rápida y eficiente, mediante un mecanismo de reputación de las publicaciones que pueden ser incluidas en los snippets que vaya más allá de la simple supervisión manual caso por caso, a medida que van apareciendo en las noticias. La inteligencia artificial depende de la calidad de los datos con los que la alimentemos: si alimentamos a Watson con el Urban Dictionary, la consecuencia es que Watson empieza a decir tacos como si no hubiera un mañana. Si permites que tus resultados destacados se contaminen con páginas sensacionalistas o tendenciosas de ínfima calidad, tus respuestas no valdrán nada.

This post is also available in English in my Medium page, “Facebook stands out against Google in the fight against fake news»

#001
Gorki - 6 marzo 2017 - 19:17
Nos pongamos como nos pongamos, fuera de campos con reglas de funcionamiento claras, como es el Go o el Ajedrez, el funcionamiento de la IA es manifiestamente mejorable, basta ver la mierda de anuncios contextuales que nos mandan, y en eso tanto Google como Facebook son parejos.
El otro día me quejaba/reía yo en Facebook de un anuncio que me mandaban a mi TL sobre un agente de Aduanas de Uruguay, concretamente de esta firma, https://www.facebook.com/munoz.asociados/?pnref=story
De donde se sacó Facebook que existan probabilidades, que Félix Maocho pueda alguna vez necesitar los servicios de un transitario de aduanas de Urtuguay, es un misterio de la IA que tiene Facebook, Lo que esta claro, es que ests firma uruguaya ha cedido su presupuesto de publicidad mundial a esta IA. ¿Es razonable? ¿No les están tomando el pelo, y la cartera, descaradamente?
- Javier - 7 marzo 2017 - 19:39
  Hola Gorki. Te respondo. Se sabe que (más o menos) somos 3 o 4 millones de personas las que hacemos publicidad en Facebook. Si el que la tiene que hacer segmenta sin tener la más remota idea, te pasa cómo a mi, que también recibo de una Universidad norteamericana sobre no se que carrera de la que ni soy afin ni me le acerco… pero ahí no hay Inteligencia Artificial, solo hay pulso, clic y malas decisiones de segmentación que siguien engrosando los bolsillos de Facebook. Saludos
#003
Krigan - 6 marzo 2017 - 23:01
Es un poco off-topic, pero respecto a los cacharros «estilo Echo» el otro día leí un nombre que me gustó. El artículo los llamaba «smart speakers», que se puede traducir como «altavoz inteligente», pero también como «hablante inteligente», o bien «parlante inteligente» («parlante significa altavoz en parte de Latinoamérica»).
Así que, con un poco de suerte, este nombre cuajará y ya tendremos nombre para esta categoría de aparatos :-)
#004
José Enrique - 6 marzo 2017 - 23:36
Google lleva un montón de años soltando mierda en sus SERP… le llamaban SEO
;-)
- Gorki - 7 marzo 2017 - 00:07
  ¡Peor! — «Enlaces patrocinados»
  Una cosa es que alguien te engañe a ti (SEO) y en consecuencia des malas respuestas y otra muy diferente es que seas tu quien trata de engañar colocando respuestas simplemente porque te han pagado.
  Google dejo la divisa » Don’t be evil «, el mismo día que decidió entrar en Bolsa, los accionistas siempre son partidarios de vender hoy mismo, las joyas de la abuela.
#006
fra - 7 marzo 2017 - 07:32
Ahora ya es tarde para Trump. Facebook en compensación al mundo deberia aplicar el algoritmo directamente a lo que dice Trump…
#007
menestro - 7 marzo 2017 - 11:31
A ver, Enrique, voy a tratar de darle un poco de sentido a lo que dices, en beneficio del reo tecnológico (lego), aunque acabo de salir de un tarro de melaza (metáfora) y aún estoy estremecido. (Broma. Aplausos)
Para empezar, estamos hablando de dos cosas totalmente diferentes, una red social en el caso de Facebook y los resultados destacados de un motor de búsqueda, los Snippets, de Google Search.
Como son dos cosas diferentes, tiene una mecánica interna diferenciada. Y no un propósito común.
Aunque ahora está de moda en la prensa ‘seria’ crear un paralelismo entre Google y Facebook por eso de que «son empresas de Internet» y meterlos en el mismo saco, ninguno de los dos son publicaciones y no sirven a un propósito único, ni a esa nueva cruzada que se ha puesto de moda que es la criba de la realidad, tratando de definir una verdad única y aceptable, sin ninguna incertidumbre o desviación de la corrección consensuada.
Y no, el propósito de la inteligencia artificial y su uso en tecnología, no es salvarnos de la falibilidad o crear un patrón de constatación de esa verdad común a todos y asumible como norma. Para eso está la biblia.
En el caso de Facebook, no existía un mecanismo de criba, ya que su propósito original no era ordenar la información y ahora, trata de evitar la difusión de fuentes poco fiables y que es un abordaje diferente al de Google.
Sí recuerdas un poco, la característica de Google que lo diferencia de otros motores de búsqueda, es un algoritmo que selecciona la información en base a su relevancia, no a su autenticidad. Si te fijas, en los primeros resultados siempre aparecen fuentes fiables por su relevancia, como la Wikipedia.
Busca lo que es importante, para quien introduce una cuestión.
Si introduces una búsqueda sobre presidentes que pertenecieron al Ku klux Klan, evidentemente abundan las páginas con conspiraciones que contienen esa información, por su mayor relevancia sobre ese tema para quien introduce esa búsqueda, no un desmentido académico de las mismas.
Y si buscas gatitos que pertenecieron al Ku klux Klan, saldrán gatitos con capirote. No te dice que los gnomos son una invención aunque, en el segundo resultado, debido a los fans, exista una descripción taxonómica de los mismos.
Porque la neutralidad de Google, permite que hasta los descerebrados encuentren lo que buscan, como no puede ser de otra manera.
No es un ministerio de la verdad; Google no es una autoridad de referencia en sí mismo.
De hecho, el segundo resultado es «Is it true that some U.S. Presidents were members of the Ku Klux Klan?» con lo que, existen bastantes probabilidades de que el artículo que mencionas como fuente… sea un Fake en sí mismo y el sesgo sea producto de quién busca conspiraciones ocultas en las empresas de Internet.
(Algún conspiranoico dirá ahora «Lo veis, Google está equivocado» «somos víctimas de una manipulación y de las burbujas de filtro”)
Y claro, se vuelve muy difícil, por un lado ser garante de la verdad y por otro, evitar esa otra supuesta conspiración Googleliana que estaba de moda hace unas semanas, de la burbuja de filtro que seleccionaba la información, en esa memoria de pez que es la última conspiración tecnológica de moda de la semana.
De hecho, me cuesta imaginar el pegamento conceptual que se está utilizando, para llegar a la conclusión impepinable de que las técnicas de IA son el bálsamo de Fierabrás para efectuar una criba de la veracidad de la información en los resultados de búsqueda de Google.
No se puede aplicar una Buzz Word de moda a todo lo que se mueve. No se debe alimentar el analfabetismo tecnológico, creando un paralelismo entre un motor de búsqueda y una red social.
Adivina lo que sucede, cuando alguien busca información sobre la singularidad en castellano, Enrique. Sí, eres una fuente de referencia sobre un bulo tecnológico, que hasta el 11 de Febrero no has empezado a ver con cierta perspectiva crítica.
Por supuesto, en España no se puede hablar de las resultados de Google News, porque a alguien le parecía buena idea forzar la mano, y actualmente somos el único país que no dispone de esa fuente de información sobre las noticias publicadas en la prensa, por los ‘Algoritmos y criterios ocultos’ según AEDE.
Así que lo único que es necesario es, esperar a que AEDE intente cobrar a Facebook por los Instant Articles por ejemplo, para que el problema se resuelva por sí solo.
Sí, evidentemente algún día tanto Google como Facebook tendrán más fiabilidad que la prensa tradicional.
Ya actualmente, es demencial la actividad de tuiteo compulsivo de los medios, con la febril esperanza de obtener alguna visibilidad.
Me voy a desayunar.
–
Garbage in, garbage out
Cómo mejora Google sus algoritmos – (Eng/sub)
Google, democracy and the truth about internet search
- Enrique Dans - 7 marzo 2017 - 11:40
  Atinas bien con el problema, pero creo que no con la crítica a mi comparación. Yo nunca homologaría a Google como buscador con Facebook como red social. Son obviamente cosas muy distintas, y en el buscador estoy de acuerdo en que debe primar, dentro de un orden, una neutralidad. Pero si ya Google hace tiempo que se dio cuenta de que su algoritmo primaba de manera excesiva el sensacionalismo, el amarillismo y la estupidez, y lleva tiempo investigando como corregirlo para dar menos valor a los atributos sociales porque han evolucionado para convertirse en un mal predictor de la relevancia, el problema toma una dimensión insospechada cuando esa misma Google decide quitar progresivamente importancia a los ten blue links y dársela a los snippets, al resultado destacado que muchos interpretan como «la verdad». A partir de ese problema, surge una responsabilidad del buscador, que en esos snippets debería llevar a cabo un proceso de curación muchísimo más importante. En la página de resultados es lícito que me aparezca basura, aunque debería ser penalizada por el hecho de serlo, pero en el destacado nunca debería aparecer, salvo que se buscase específicamente indicándolo como tal. Y dado que Google parece pretender dejar de ser un motor de búsqueda para pasar a ser una «máquina de la verdad», sus responsabilidades cambian drásticamente. Y si no lo ven, se encontrarán con una erosión brutal de su credibilidad y con un problema potencialmente muy serio.
  - José Enrique - 7 marzo 2017 - 11:45
    NOSOTROS nos dimos «cuenta de que su algoritmo primaba de manera excesiva el sensacionalismo, el amarillismo y la estupidez».
    Lo de que «lleva tiempo investigando como corregirlo para dar menos valor a los atributos sociales porque han evolucionado para convertirse en un mal predictor de la relevancia» es algo que habrá que ver…
    - Enrique Dans - 7 marzo 2017 - 12:46
      No NOSOTROS, sino ELLOS. Lo de que llevan tiempo trabajando en el tema está más que demostrado, y lo he comentado ya en entradas como esta… otra cosa es que estén siendo lentos o que no les termine de salir la cosa, que por otro lado no es en absoluto fácil!
  - menestro - 7 marzo 2017 - 12:32
    El gran problema, es que Google es un espejo de nosotros mismos, que como en el caso de la madrastra de blancanieves, no responde a nuestras expectativas, sino a nuestro sesgo personal de la realidad.
    Sí, es necesario mejorar el como interpretamos el resultado de una búsqueda, para evitar pensar que la verdad está en el primer link.
    Pero eso, también es un problema menor, por la novedad de los snippets como forma de complementar los Knowledge Graph que hasta ahora suelen funcionar bastante bien, y son un fuente de información valiosa.
    (Por ejemplo, durante las olimpiadas se podía seguir los resultados y perfiles de los deportistas en la primera página de Google)
    Nada que ver, con tener que restringir la información que difunden los propios usuarios de Facebook, en lo que se interpretaría como un intento de censura de opiniones ‘alternativas’.
    Son problemas opuestos, por cuanto uno se refiere a la diversidad de información en la Web, y el otro a la difusión dentro de una red social del propio contenido de los usuarios.
- Gorki - 7 marzo 2017 - 12:25
  Para una vez que entiendo a Manestro,…. y resulta que estoy de acuerdo.
  El problema es que Google nunca ha medido calidad, sino popularidad, por eso pone a «Belen Esteban» por delante de «Teresa de Calcuta», si pides mujeres importantes del siglo XX. Ese ha sido un error con el que carga Google, desde que empezó a valorar en plano de igualdad, las tonterías que yo pueda poner en mi blog, con los «papers» de la American Scientific Society.
  Ese es el pecado de Google y a eso es a lo que tiene que dedicar sus energías para corregirlo, y mas aun, si pretende ser quien defina los conceptos de todas las cosas. No se puede presentar como cierta la historia del Ponferradina, leyendo el blog de un forofo del Ponferradina.
  Lo de Facebook, es otra cosa, solo conecta amigos entre si, y si no se mete en sus conversaciones, mejor que mejor.
  Lo malo, es que tanto Goole como Facebook, pretenden ocupar la plaza vacante de Oráculo de Delfos, y en mi opinión ninguno de los dos no tiene talla para ello.
  - José Enrique - 7 marzo 2017 - 12:43
    Y… ¿por qué corregirlo?
    Funciona fenomenalmente bien así. Otra cosa es que «alguien» se haya creído que lo que sale en Google es la «verdad». Pero ese es un problema cultural propio, suyo y personal; con solución difícil pero no imposible. Hay quien «cree» que la «verdad» es lo que «sale» en la Biblia o en el Corán o en el blog de algún paranormal o algún pseudocientífico… Quien piensa que la verdad es la que dice Rajoy, la que dice Iglesias o, incluso, la de Pedro Sánchez.
    ¿Ha nacido Google para refutarlo todo? NO. Hay que tener capacidad crítica con lo que uno lee… da igual en los resultados de Google, en la Wikipedia o en las páginas de La Razón.
    ¿De qué hablamos entonces? Pues de que Google (y La Razón) «dice» que ellos tienen la verdad por el mango. Y alegan (en el caso de Google) su empleo casi mágico de la cosa esa: «Inteligencia Artificial»… un concepto tan «artificial» como la Leche sin Lactosa. Pero eso es marketing: ni Google está en posesión de la verdad ni las bebidas sin lactosa son leche… salvo por el color.
    Desde el punto de vista de Facebook la cosa es distinta: están más próximos a La Razón. ¿Por qué? pues porque su modelo de negocio es la segmentación… y segmentan diciéndole a cada uno lo que creen que quieren oir (leer, ver, conocer…)
    Se «segmenta» dando biblias a los que creen que la verdad viene en la biblia.
    Una vez hacen esto, venden publicidad orientada a ese segmento. Y también les va muy bien… no creas.
    «Refutar» la Biblia no sirve para nada. A la gente hay que darle capacidad de crítica… y de autocrítica. No argumentos a favor y en contra.
    - Gorki - 7 marzo 2017 - 14:35
      ¡Co**!, Hoy estoy de acuerdo con todos,…. ¿qué me pasará?
#015
DANN ELIO - 7 marzo 2017 - 18:19
Cuando estamos dentro de la página de google.es, y escribimos dentro del cajetín las palabras «tiempo» o «clima»…nos aparece inmediatamente, y como resultado #1, una tarjeta a modo de snippet.., un bonito «graphic snippet», que además de la temperatura, humedad relativa, y velocidad del viento, te informa también..de la ciudad donde te encuentras, por si andas muy despistado :-) o vas en un tren bala y te preguntas qué ciudad estás atravesando en determinado momento…Tremendamente útiles todos estos DATOS. Y funciona también sin pegas desde el smartphone, seas de Android o de iOS. Vamos…una gozada de widget, como le llamaba yo….o mejor dicho de snippet ( para ser más precisos con su nombre), como he aprendido hoy que se les llama a estas tarjetas informativas especiales. Los Datos son el petróleo del siglo XXI. Y para que sean útiles tienen que ser de CALIDAD. Y el indicativo Nº1 de calidad de cualquier info y/o dato es su CONFIABILIDAD. Solo datos fiables pueden dar lugar a decisiones fiables..merecedoras de ser INDEXADAS con total libertad en cualquier buscador..( Este problema no es sólo de Google, en mi modesta opinión…) Si una información no-cierta entra en una «dinámica de difusión» y se «enquista» mucho te la puedes encontrar reproducida en un buscador de Bing, de Yahoo Search…y si no encuentra ninguna «barrera» a la difusión, nos la terminaremos encontrando hasta en los buscadores «independientes»..ya sea DuckDuckGo o similares…Da igual…la «burbuja» informativa ( o mejor dicho desinformativa ) les llega…Tardará más o menos en subir a la superficie la burbujita de marras..pero acabará subiendo, y la terminaremos «consumiendo»…O mejor dicho «sufriendo»…porque unos discriminarán bien la trola, y otros no, que puede que hasta tomen decisiones de todo tipo en base a esas informaciones erróneas. Solo me duele una cosa de todo esto: ¡ Cuánto tiempo online tirado a la basura!! Literalmente perdido….lastimosamente perdido…Donde la gente tendria que estar pensando en apadrinar a un niño del tercer mundo para que no muera de deshidratición, de enfermedad, o de las 2 cosas a la vez…Donde la gente tendria que estar haciendo acopio, resultado tras resultado de cada búsqueda, de información objetiva y veraz sobre todas las causas de cancer en humanos ( para poder derrotarlo por completo y erradicarlo como causa de mortalidad..por ejemplo ) Pues ya ves…todo esto dá mucho coraje…y también mucho miedo: para que no nos quejemos de que están limitando nuestra libertad de «consumo» desinformativo, o mejor aún..para que no digamos que son unos «ogros» que nos oprimen y que nos censuran..¿ Para que ese mundo de navegación «happy» sea posible…¿ tenemos que dejar a todos nuestros internautas abandonados a su suerte..y consumiendo un montón de incertidumbres, de garbage, y de «ruido» informativo inservible..que les alejan del conocimiemto, de la verdad, y del trabajo útil y saludablemente productivo..???? Pues no sé yo…tengo mis dudas….Dudo mucho si la libertad total…y sin disciplina ninguna es buena..? ?? Al parecer hay gente que prefiere desperdiciar su limitado tiempo libre en averiguar por internet si Lady Gaga tiene pene, o si no lo tiene. ( No lo busqueis, por favor…No tiene pene. :-) :-) Es un bulo. Es como lo de los chemtrails…..y todas esas mierdas….))
A ver…a cada situación habrá que darle su justa medida…un control muy férreo, indiscriminado, y poco inteligente seria muy perjudicial para todos como sociedad. En Google no son ni buenos, ni malos. Ni tampoco son (ni van a ser) «Los Guardianes de la Verdad»…Simplemente son: una EMPRESA. Y como tal, tienen que cubrir objetivos..y crecer económicamente. Su negocio está basado en los DATOS..y si los datos «palman» porque no son ciertos…La empresa palmará (palmaría) con esa situación, sería solo cuestión de tiempo.
Vamos, y como opinión personal mía, yo para mi alimentación y para mi salud (la salud informativa también puede enfermar) si voy a la frutería, y me quiero llevar manzanas…tanto si me compro una caja…como si me llevo cinco cajas…yo lo que quiero es tener la tranquilidad, la certeza, y la «visual» de que todas las manzanas que voy a consumir están en pluscuamperfecto estado. Y luego..si hay gente que quiere pagar, y por el mismo precio que yo pago, y comerse piezas podridas…encontrarse gusanos, o perder el 90% del tiempo de su navegación para discriminar lo real de lo imposible, o simplemente de lo «aparente», para luego descubrir que la mitad o más de lo leído es totalmente inservible. Vale. Pues ese tipo de internautas que se dediquen a «limpiar» por la basurilla por la que han pagado. Yo, si me entero que una empresa me hace eso, y que no le pone remedio ninguno…Y ya no «le compro» la información nunca más. Pero bueno. Allá cada cual con su vida. A mí este mes la conexión a internet me la han subido 5 pavos ( ni me lo han avisado, ni tengo más servicios por ello, simplemente me la clavan la subida en la factura, y ya está. ). Si tengo que pagar o sí o sí, y tengo que soportar subidas de precio, de la cuantía que les dé la gana a las telecos, yo quiero que la información que recibo esté en un estado PERFECTO. Es la única opción válida. La única que yo admitiría. Que para eso pago…que para eso pagamos todos cada mes…caramba !!!
*Nota: Se conoce que la red de fibra que han desplegado, mucho más veloz y «molona», vale mucha pasta…Pasta que alguien tendrá que pagar: pues la vamos a pagar entre todos los abonados. Lo curioso es que esta «subidita» no nos salía anunciada en ningún snippet..¡ Qué cosas ! ¿verdad ? ;-) :-) ;-)