Un evento “sin precedentes” de Google Cloud borra la cuenta del cliente y sus copias de seguridad


Enterrado bajo las noticias de Google I/O de esta semana se encuentra uno de los mayores errores de Google Cloud: el competidor de Amazon Web Services de Google eliminó accidentalmente una cuenta de cliente gigante sin ningún motivo. A UniSuper, un fondo de pensiones australiano que gestiona fondos por valor de 135.000 millones de dólares y tiene 647.000 miembros, se le borró toda su cuenta en Google Cloud, incluidas todas las copias de seguridad que estaban almacenadas en el servicio. Afortunadamente, UniSuper tenía algunas copias de seguridad con un proveedor diferente y pudo recuperar sus datos, pero según el registro de incidentes de UniSuper, el tiempo de inactividad comenzó el 2 de mayo y la restauración completa de los servicios no se produjo hasta el 15 de mayo.

El sitio web de UniSuper ahora está lleno de pesadillas administrativas de lectura obligada sobre cómo sucedió todo esto. La primera es una página salvaje publicada el 8 de mayo titulada «Una declaración conjunta del director ejecutivo de UniSuper, Peter Chun, y el director ejecutivo de Google Cloud, Thomas Kurian». Esta declaración dice: «El director ejecutivo de Google Cloud, Thomas Kurian, ha confirmado que la interrupción surgió de una secuencia de eventos sin precedentes por la cual una mala configuración involuntaria durante el aprovisionamiento de los servicios de nube privada de UniSuper finalmente resultó en la eliminación de la suscripción a la nube privada de UniSuper. Esta es una situación aislada, «Ocurrencia única» que nunca antes había ocurrido con ninguno de los clientes de Google Cloud a nivel mundial. Esto no debería haber sucedido. Google Cloud identificó los eventos que llevaron a esta interrupción y tomó medidas para garantizar que no vuelva a suceder. «.

En la siguiente sección, titulada «¿Por qué duró tanto el corte?» la declaración conjunta dice: «UniSuper tenía duplicaciones en dos geografías como protección contra interrupciones y pérdidas. Sin embargo, cuando se produjo la eliminación de la suscripción a la nube privada de UniSuper, provocó la eliminación en ambas geografías». Cada servicio en la nube mantiene copias de seguridad completas, que se podría suponer que están destinadas a los peores escenarios. Imagine que un hacker se apodera de su servidor o que el edificio en el que se encuentran sus datos se derrumba, o algo así. Pero no, el actual El peor de los casos es «Google elimina su cuenta», lo que significa que todas esas copias de seguridad también desaparecerán. Se supone que Google Cloud tiene medidas de seguridad que no permiten la eliminación de cuentas, pero aparentemente ninguna funcionó, y la única opción era una restauración desde un proveedor de nube independiente (agradecimiento al héroe de UniSuper que eligió una solución de múltiples nubes).

UniSuper es un «fondo de jubilación» australiano; el equivalente estadounidense sería un 401(k). Es un fondo de jubilación al que los empleadores aportan como parte del cheque de pago de los empleados; En Australia, la ley exige una cierta cantidad de pago de superfondo a todas las personas empleadas. La gestión de fondos por valor de 135.000 millones de dólares convierte a UniSuper en una empresa lo suficientemente grande como para que, si algo sale mal, llame por teléfono al director ejecutivo de Google Cloud en lugar de al servicio de atención al cliente.

Un comunicado de prensa de junio de 2023 promocionó la gran migración a la nube de UniSuper a Google, y Sam Cooper, jefe de arquitectura de UniSuper, dijo: “Con Google Cloud VMware Engine, la migración a la nube es simplificada y extremadamente fácil. Se trata de eficiencias que nos ayudan a ofrecer tarifas altamente competitivas para nuestros miembros”.

Las muchas partes interesadas en el servicio significaron que la restauración del servicio no se trataba solo de restaurar las copias de seguridad, sino también de procesar todas las solicitudes y pagos que aún debían realizarse durante las dos semanas de tiempo de inactividad.



Source link-49