Google Potencia Capacidad de Sus Routers de Demanda y Extiende Vigencia de SLA a Clientes

La compañía anunció medidas de ingeniería que evitarán que, en condiciones similares, sus sistemas vuelvan a presentar la misma falla de principios de mes.

 

10 de Septiembre de 2009 – Tras la falla del pasado 1º de septiembre, junto con aclarar las causas del problema, Google anunció las medidas correctivas tomadas por su equipo de ingeniería y la extensión automática en tres días de la vigencia de su SLA (Service Level Agreement) a sus clientes de Google Apps.

 

La compañía subrayó que la falla, que se extendió durante una hora y media, sólo afectó a la interfaz Web de Gmail y no a los accesos vía IMAP y POP, y que no significó la pérdida de datos ni la no distribución de los correos.

 

Google anunció también que el equipo de ingeniería de Gmail, tras detectar la causa –una subestimación en la carga de los routers de demanda durante una actualización rutinaria – decidió realizar algunas acciones tendientes a evitar su repetición en el futuro.

 

La primera de ellas es el incremento de la capacidad de sus routers de demanda incluso más allá de las estimaciones de los peaks. También se decidió aislar las fallas de routers de demanda para que, ante eventuales problemas, ellas se limiten sólo a un data center específico y no afecten a los servidores de otros centros de datos.  De esta forma, en casos en que se diera el caso de que múltiples routers fuesen sobrecargados simultáneamente, éstos continuarán funcionando aunque sea en un rango reducido en lugar de rechazar las conexiones e intentos para diferir su carga, como aconteció a inicios del mes.

 

Además de estas medidas de ingeniería, Google como una forma de compensar los eventuales daños de sus clientes decidió extender el crédito de sus cuentas de SLA en 3 días, la cual se concretará automáticamente.

 

Quienes deseen ver aspecto clave del incidente pueden revisar el reporte.