Lo accesorio y lo importante

IMAGE: Max Pixel (CC0)

La nube de Google sufrió ayer domingo una caída que duró aproximadamente seis horas y afectó a varios servicios de la propia compañía como Gmail, G Suite, Nest o YouTube, y de algunas otras compañías como Shopify, Snap o Discord. Tras la recuperación de los servicios, a la compañía le tocará llevar a cabo los análisis adecuados para identificar las posibles causas del problema, tratar de compensar a los afectados e intentar evitar que vuelva a suceder.

Mi reflexión sobre el tema, obviamente, no trata de informar sobre el hecho, ya abundantemente reportado en todas partes, sino de plantear hasta qué punto pueden resultar críticos determinados servicios cuya continuidad tendemos a dar por sentada, pero que como todo, puede fallar. Este tipo de caídas en el servicio son buenas precisamente para evaluar nuestro nivel de dependencia, pero más aún, para poder darnos cuenta de su criticidad, de las cosas que son accesorias frente a las que son importantes.

Una caída de servicios de Google, algo que afortunadamente es muy poco frecuente que tenga lugar de manera generalizada o significativa, puede afectar a que muchas compañías que utilizan su servicio de correo electrónico o sus aplicaciones de tratamiento de documentos de todo tipo sufran complicaciones. Estas complicaciones, que en el caso de Google nunca se han prolongado más allá de unas pocas horas, pueden ser serias si la caída se produce en un día laborable, y dar lugar a problemas o a impactos significativos en la operativa del negocio. Otras complicaciones generalmente menores pueden ser problemas con servicios como Nest, que gestionan termostatos en hogares, cuyo impacto en un caso de interrupción de pocas horas es escaso y que, por lo general, podrán ser accionados manualmente, o con otros aparatos conectados de diversos tipos. Una caída de servicios de Google tiene un impacto sin duda potencialmente importante: muchas personas, confrontadas con la idea de no poder realizar algo tan habitual y cotidiano como una búsqueda o experimentar interrupciones en la funcionalidad de su correo electrónico o de sus documentos, se daría cuenta de hasta qué punto Google se ha convertido en crítico en nuestra vida diaria. Sin embargo, la reflexión inmediata seguramente no debería ser «voy a reducir mi nivel de dependencia creando un sistema en paralelo», porque parece claro que prácticamente ninguna compañía es capaz de alcanzar las estadísticas de fiabilidad de Google.

¿Qué pasa si hacemos esta misma reflexión con otras compañías? Si se cae Facebook, por ejemplo, las complicaciones son indiscutiblemente menores. ¿No poder actualizar redes sociales como la propia Facebook o Instagram? Seguramente habría quien entrase en pánico, pero eso solo indicaría algún tipo de disfuncionalidad en su asignación de prioridades. ¿No poder comunicarte mediante WhatsApp? Molesto, sin duda… pero existen muchas alternativas, incluyendo, si es urgente, la de llamar por teléfono.

¿Si quien cae es Amazon? Ante una interrupción de servicios de Amazon, dada la importancia y la penetración de su nube, las consecuencias podrían ser de todo tipo, y afectar a prácticamente cualquier compañía que utilice sus servicios. Los servicios de la propia Amazon, en caso de interrupción, podrían suponer problemas en cuanto al indudablemente elevado impacto en facturación por cada minuto de caída, y extenderse no solo a Amazon sino a sus muchos socios que utilizan sus servicios.

En su muy recomendable libro «Utopía para realistas«, el historiador holandés Rutger Bregman compara el impacto que tuvo la huelga de empleados de banca en Irlanda en 1970 con la de los trabajadores de recogida de basuras en Nueva York en 1968: mientras en el primer caso, que se prolongó por espacio de seis meses, la economía irlandesa fue capaz de seguir funcionando – y hasta creciendo – simplemente haciendo frente a algunas molestias menores, como incrementar el uso de cheques como sustituto del dinero en efectivo, en el segundo, las autoridades de la ciudad, en estado de emergencia ahogada por cien mil toneladas de basura acumulada, se vieron obligadas a negociar y a ceder ante la mayoría de las reivindicaciones de los trabajadores a los nueve días.

¿Qué servicios y qué compañías en la red han conseguido situarse, en relativamente pocos años, en una posición tan crítica como esa? ¿Cuáles, en cambio, son perfectamente prescindibles, y su efecto sobre nuestras vidas, en caso de disrupción de sus servicios, sería simplemente de pequeñas molestias, o prácticamente nulo? Creo que, a todos los niveles, puede ser una reflexión muy interesante.


This post is also available in English on my Medium page, «Could you survive without Gmail for six hours?«


27 comentarios

  • #001
    Raul - 3 junio 2019 - 13:19

    Algún día se cae algún medio de pago importante… Ese día vamos a disfrutar de lo lindo.

    • Asier - 3 junio 2019 - 17:18

      Es lo que tienen los sistemas centralizados. Bitcoin nunca se cae.

    • Bertie - 3 junio 2019 - 17:37

      Ya ha pasado. Un banco español de los grandes estuvo caído el año pasado casi toda una mañana. No solo su servicio público de banca por internet, sino también las aplicaciones internas, de forma que ni en las oficinas se podía hacer nada.

  • #004
    Gorki - 3 junio 2019 - 14:29

    Aunque parezca un contrsentido hemos de prever que sucedan imprevistos. El problema es que dificilmente podemos prepararnos contra algo que por su propia esencia es imprevisible.

    Curiosamente los países peor preparados contra imprevistos,. son los que mejor los soportan, El que se vaya la luz en Beluchistán, (pongo por caso), solo supone molestias menores, así como casi no se nota una huelga de seis meses de los servicios médicos en Nigeria.

    Los problema mas graves se presentan en países como el nuestro, muy poco dado a prever contingencias y que por otra parte, tiene el suficiente desarrollo para que la sociedad dependa gravemente del buen funcionamiento de cientos de productos y servicios.

    Estoy de acuerdo que cuando estos eventos imprevistos ocurren, lo mejor que podemos hacer es aprender de la experiencia y montar servicios alternativos que mitiguen los fallos, aunque mi experiencia, por ejemplo con los SAI delos ordenadores, es que estos a la hora de la verdad fallan, por haberse quedado obsoletos, porque nadie se preocupa de mantenerlos, porque la gente desconoce hasta la existencia de esos sistemas. y
    porque cuando ocurre un nuevo incidente, este no es exactamente igual al anterior y lo previsto no cubre esa contingencia

    Lo cierto es que a lo largo de mi vida han ocurrido «fallos catastróficos » y la verdad es que los problemas no llegaron a la magnitud que se sospechaba.

    Me acuerdo del Apagón de Nueva York. que fue terrible y dio lugar algún desorden público pero que en principio creo menos problemas de los previsibles en la cu ciudad de los rascacielos.
    https://es.wikipedia.org/wiki/Apag%C3%B3n_de_Nueva_York_de_1977

    Otro caso que recuerdo, fue el incendio de la Central de Plaza de Cataluña de Telefónica, que dejó totalmente incomunicado el centro bancario, financiero y comercial de Barcelona https://www.youtube.com/watch?v=Fe9tMFvz7gI

    Por entonces yo trabjaba en TVE en Mirarmar pero las central estaba en Paseo de Gracia y pese a tener todo tipo de prioridades estuvimos sin podernos comunicar unas tres semanas. Nada digo de los pequeños comercios de la zona. Pues a pesar con mensajeros que iban de un lado para otro nos arreglamos mejor de lo que parecía posible.

    El «fallo catastrofico» que mas me alteró el país fue el asesinato de Carrero Blanco, que me cogió también trabajando en TVE. La parálisis que semejante hecho genera en un país con un sistema piramidal de gobierno, donde todas las decisiones han de pasar por un punto situado en El Pardo, es como para vivirla, es difícil de imaginarla..

    • Isangi - 3 junio 2019 - 16:35

      «dificilmente podemos prepararnos contra algo que por su propia esencia es imprevisible.»

      De eso sabe mucho NNTALEB (aunque, obviamente, como hace aquí EDANS, centra esos esfuerzos en lo que es crítico).

      • Gorki - 3 junio 2019 - 17:59

        ¿NNTALEB? – No lo he encontrado en Google ¿Quizá NASSIM N. TALEB?

        • Isangi - 4 junio 2019 - 10:49

          Si ese :D

    • Javier - 4 junio 2019 - 14:29

      El problema con los SAI que fallan cuando realmente se necesitan (cuando repentinamente tenemos un corte) es que las baterias hay que cambiarlas Si o Si cada cierto tiempo, además que como bien dices hay que hacerles chequeos y monitorización. No únicamente es comprarlos, conectarlos y dejarlos escondidos detrás del pc.

      • Gorki - 6 junio 2019 - 17:56

        Lo que hay que hacer lo sabemos todos, lo que se hace también.

        Cuando trabajé con mi primer IBM34, IBM me obligo a poner una linea de tierra que fuera tal, que terminaba en una piqueta clavada en el sótano, dentro de un hoyo con sales y me dijeron que debía echar agua cada tres meses, Nunca lo hice

  • #010
    menestro - 3 junio 2019 - 14:39

    Nest ya no forma parte de los productos de Google desde el mes pasado. (Quel malade!)

    Lo que se produjo fue una congestión que ralentizo lo servicios de Google Compute Engine en la zona este de EE.UU. y ahora parece, que se ha trasladado a algunos países del Nodo de Frankfurt en servicios distribuidos desde el mismo cluster de EE.UU.

    «Google» ‘Per se’ no se puede caer, porque está distribuido en numerosos datacenters a lo largo de todo el mundo. Una de las cualidades de la ‘nube’ es precisamente la ubicuidad y replicación de los servicios.

    Funcionaba genial en la India en Francia o Italia.

    En Europa disfrutamos de un buen número de nodos neutros y datacenters de Google independientes de la zona este de EE.UU.

    Ahora, si tienes tu página o microservicios en el cloud de Virginia o Carolina del Sur (us-east1 – east4), pues sí, has hecho una desafortunada geolocalización de tus recursos el fin de semana pasado.

    Es trivial trasladar los servidores de la nube de la costa de EE.UU. a los datacenter de Dublin o Frankfurt. Se tarda segundos en hacerlo y rehabilitar el servicio.

    Puestos a especular, la causa puede ser precisamente las pruebas alfa del nuevo servicio Cloud Armor.

    Mapa del Cloud de Google


    Disclaimer.

    Expertos de la conspiración y la vigilancia, como Zeynep o ZeroHedge, ya han anunciado el apocalipsis y la redención de nuestros pecados, contra el criterio de todos los ingenieros, así que llevad una muda limpia.

    Los autobuses del armagedón semanal están aparcados en intercambiador de transporte más cercano.

    Es un buen momento para captar suscriptores poniendo paywalls dinámicos, y desviando a los lectores a otros medios con una buena cobertura de la noticia.

      • menestro - 4 junio 2019 - 16:03

        A ver, lo aclaro un poco más.

        Nest ya no forma parte de los proyectos de «Google Home Hub» y a partir del 31 de agosto se abandona el proyecto “Works with Nest”.

        Ese proyecto se renombrará como “Google Nest Hub” y se integrará junto con el asistente de Google (Sí, ese que funciona con Duplex)

        Los dispositivos se venderán en la Google Store, exclusivamente.

        Lo que ha dejado de funcionar durante el ‘Outage’ del servicio es la apertura remota para invitados desde la App, enviando un codigo temporal, no la cerradura de la puerta, que sigue manteniendo un bonito display numérico totalmente offline y con batería propia con el que abrirla.

        La Fake News se produjo al confundir el acceso remoto con la imposibilidad de abrir la cerradura o regular la calefacción de forma presencial, en la misma casa.

        Este es el origen de la noticia del bloqueo de invitados, en Hacker News, uno de los primeros sitios en los que se detecto la caída del GCE en la costa Este de EE.UU.

        Y de ahí, los medios crearon una bola de nieve, con miles de personas atrapadas y horneándose en sus casas.

        Eso es debido a que Nest depende de servicios GCP como Google Cloud Dataflow y Google BigQuery para el acceso remoto y las métricas de sus dispositivos.

  • #013
    Ángel "el bueno" - 3 junio 2019 - 15:31

    ¿Te imaginas que algún día cayesen durante unas horas determinados gobiernos? Solo durante unas horas….

    • Isangi - 3 junio 2019 - 16:36

      si no es por las noticias, ni nos enterariamos. ¿no estuvieron en algún pais europeo, y en España, Meses en un cambio de gobierno? pues eso…

  • #015
    Isangi - 3 junio 2019 - 16:42

    Yo he visto a mucha gente cabreada con Google, pero en general eran quejas generadas por exceso de confianza hacia el servicio, estás tan acostumbrado a que googleDrive no falle nunca, que cuentas con esa hoja accesible desde el movil para un evento el domingo lejos de tu casa. En el evento se cae GDrive y te jode bien. Si GDrive fallase más a menudo, esta persona de ejemplo hubiera llevado consigo una copia de seguridad y listo.

    También se ha notado que algunos servicios «físicos» en la nube no son nada buenos si no tienen alternativa, Nest es un ejemplo, pero relativamente poco importante, pero por lo visto había cerraduras de casa que no se abrian y no tenían alternativa para abrirlas sin acceso a la nube. al igual, menos importante, que iluminación de casa.

    Como dices, hay que hacer una valoración de lo importante, y de lo importante tienes que tener copia(si es digital) o alternativa(si es fisico), sí o sí. Pero eso, los que tenemos algo de experiencia en tecnologías y un poco de criterio desconfiamos cuando nos venden «según que milagros de la nube» (o del 5g ahora que está tan de moda). 6h sin entrar en mi casa porque Google a caido no es aceptable, pero NO es culpa de Google.

    Por no hablar, como otro ejemplo, de los problemas que ocasionó la aplicación de urgencia y forzada de los parches contra meltdown en la nube de Azure que causó problemas graves que tardaron dias en atender sus técnicos a empresas pequeñas como en la que yo estaba…

  • #016
    Pedro Torres Asdrubal - 3 junio 2019 - 17:16

    La guardia civil nos dijo que evacuáramos ante el avance de las llamas. Agarré las muletas, mi reciente esguince de tobillo, y arranqué campo a través con mi torre.

    Nada como una crisis para evaluar que es importante, pero sin pasarse y llegar al dilema existencialista de que nada lo es.

  • #017
    Gorki - 3 junio 2019 - 17:49

    Creo que algunas iglesias evangélicas, no estoy seguro si son los cuákeros, se les «pide» a sus miembros que conserven en sus casa reservas de comida y bebida para la menos 15 días.

    Yo creo que tener cierta cantidad de alimentos en la despensa, que no precisen nevera, para aguantar 15 días, es una norma conveniente para estar a cubierto de esos «fallos catastróficos», que pueden vaciar los supermercados en menos de una hora.

  • #018
    LOS PANCHOS - 3 junio 2019 - 18:20

    Hace ya un tiempo un familiar me comentó su preocupación porque había oído que Microsoft iba a discontinuar XP. Me quedé mirándolo y simplemente le pregunté ¿Pero tú no tenías tu PC con un windows pirata? La respuesta fue si, pero ahora no tengo soporte…. y mi respuesta, ya los soportes solo lo necesitan las grandes empresas…

    Los medios y este artículo en particular, parecen preocuparse por algo parecido, la mayoría de los clientes de google se preguntarán, si tengo un gdrive o gmail y me quedo sin él ¿Puedo reclamar?. Entiendo que si, ya que el producto parece gratuito pero no lo es,… así que esperamos que durante 6 horas no haya publicidad, el motor de búsqueda sea agnóstico, etc etc. ¿Y si soy una empresa que tiene contratado un servicio de pago en la nube? pues tu mismo…

    Ahora bien, las explicaciones están al nivel de un servicio CAREFREE, Vienen a decir que si nos hemos dado cuenta que tenemos el servicio caído por que hay una gran congestión de red y hemos detectado la causa raíz. Pero las explicaciones del postmortem ya las daremos a su tiempo. Que es como ir al médico y te dicen el enfermo está muy enfermo, y cuando hagamos la autopsia veremos que le ha pasado…
    vamos que son una joya de transparencia. Qué hay congestión de red no es una causa es un efecto.

    Tomando el ejemplo de Gorki, se quema una central en Barna, imaginemos a Telefonica diciendo: «Señores abonados no tienen teléfono porque no hay suficientes líneas disponibles pero no se preocupen que conocemos la causa raíz, y haremos un informe»

    Las mejores frases que he leído son para enmarcar:

    * google no puede caer, al estar distribuido (pues cayó)
    * funcionaba genial en tal sitio ( pena no saberlo con una semana de antelación para visitar Paris)
    * si tus servicios dependían del nodo afectado, pues ajo y agua. Haber elegido susto ( esta es la mejor)

    etc, etc Curioso que no ha habido ninguna teoría de la conspiración ligando el FUERA DE SERVICIO de google al trigésimo aniversario de la matanza de Tiananmén que se celebra mañana 4 de junio, pero como hay muchos de ellos no se acuerda nadie… o si? y hay unos hackers que ha boicoteado google por dar 3 meses de próroga a Huawei??? (ES COÑA)

    Pues nada en línea con la utopía para realistas, dejemos de leer los ads de las empresas que no son lo suficentemente claras con lo que les sucede y nos dejan sin servicios.

  • #019
    Enrique - 3 junio 2019 - 18:50

    Enrique, una pregunta muy directa y sin malas intenciones, ¿se está pinchando la burbuja Tesla?

    • Gorki - 3 junio 2019 - 21:01

      14/12/2018 valor de la acvcion 367,79
      a partir de entonces linea de tendencia descendente hasta 185,16 que vale hoy
      Una caida de un 50% en seis meses
      Y siguen sucediendo extraños incidentes con los a coches Tesla
      https://actualidad.rt.com/actualidad/316799-belgica-tesla-incendiarse-estacion-carga

    • Enrique Dans - 3 junio 2019 - 22:04

      No se puede pinchar lo que no existe. Nunca hubo una burbuja Tesla, es simplemente una compañía que muchos no son capaces de entender porque su fin no es simplemente cambiar dinero, sino cambiar el maldito mundo.

      • Gorki - 3 junio 2019 - 22:34

        Será por eso, por lo que va tan mal en la Bolsa

    • ALAN TURING - 3 junio 2019 - 23:03

      A Tesla le vendría muy bien que algún gigante tecnológico comprara la mitad de sus acciones y la sacara de la Bolsa, así estaría a salvo de los especuladores y podrían serenarse y centrarse en hacer buenos coches eléctricos.

  • #024
    Ignacio F - 3 junio 2019 - 20:52

    Es por eso que hay que diversificar en los servicios que usamos, no solo cambiar cuando uno tiene problemas.
    Aunque este problema parece estar localizado solo a un par de regiones.

  • #025
    Ferran Pi Roca - 4 junio 2019 - 08:06

    Sin duda hay riesgos, pero forma parte del desarrollo. Google y otras compañias han estado innovando y han solucionado muchas necesidades aportando un valor incalculable. Podemos enfocarnos en crear y aprovechar oportunidades o enfocarnos en los riesgos. Si decidimos enfatizar lo segundo nos quedaremos parados. Me recuerdan esos padres que, con la mejor intención, están constantemente alertando a sus hijos de los riesgos: «no te subas ahí…», «no hables con desconocidos….», «no vayas por otro camino….»

  • #026
    Orlando - 4 junio 2019 - 18:59

    Hola Enrique. Muchas gracias por el artículo y llevarnos hacia esa apreciación sobre ese hecho. Pienso que efectivamente no estamos ni mucho menos capacitados, digo la población en general, para realizar una evaluación de prioridades sobre lo que puede ser un riesgo real o no, o aquello que puede ser urgente o crítico. Esta realidad digital que hemos creado nos lleva a vivirla tan propia, que hay quienes desesperan ante ínfimas pausas de la misma. Así que como dices, siempre será bueno las reflexiones de este tipo.
    Nuevamente muchas gracias. Saludos!

  • #027
    acerswap - 4 junio 2019 - 20:40

    Creo que subestimas a FB. No olvides que tambien se usa como sistema de autenticacion (los famosos botones de «Iniciar sesion con Facebook») para paginas de terceros. Por eso nunca uso esos botones si tengo otra opción.

Dejar un Comentario a acerswap

Los comentarios están cerrados