Esta página ofrece una descripción general de la configuración de alta disponibilidad (HA) para instancias de Cloud SQL. Para configurar una nueva instancia para HA o habilitar HA en una instancia existente, consulte Habilitar y deshabilitar la alta disponibilidad en una instancia .
Descripción general de la configuración de HA
El propósito de una configuración de alta disponibilidad (HA) es reducir el tiempo de inactividad cuando una zona o instancia deja de estar disponible. Esto puede ocurrir durante una interrupción zonal o cuando hay un problema de hardware. Con la alta disponibilidad (HA), sus datos siguen estando disponibles para las aplicaciones cliente.
La configuración de alta disponibilidad (HA) proporciona redundancia de datos. Una instancia de Cloud SQL configurada para alta disponibilidad (HA) también se denomina instancia regional y cuenta con una zona principal y una secundaria dentro de la región configurada * . Dentro de una instancia regional, la configuración consta de una instancia principal y una instancia en espera . Mediante la replicación síncrona al disco persistente de cada zona, todas las escrituras realizadas en la instancia principal se replican en los discos de ambas zonas antes de que se confirme una transacción. En caso de fallo de una instancia o zona, la instancia en espera se convierte en la nueva instancia principal. Los usuarios se redirigen entonces a la nueva instancia principal. Este proceso se denomina conmutación por error (failover) .
Tras una conmutación por error, la instancia que la recibió continúa siendo la instancia principal, incluso después de que la instancia original vuelva a estar en línea. Una vez que la zona o instancia que sufrió una interrupción vuelve a estar disponible, la instancia principal original se destruye y se vuelve a crear. A continuación, se convierte en la nueva instancia en espera. Si se produce una conmutación por error en el futuro, la nueva instancia principal conmutará por error a la instancia original en la zona original.
Si necesita que la instancia principal permanezca en la zona afectada por la interrupción, puede realizar una conmutación por recuperación . Esta conmutación realiza los mismos pasos que la conmutación por error, solo que en la dirección opuesta, para redirigir el tráfico a la instancia original. Para realizar una conmutación por recuperación, siga el procedimiento descrito en "Inicio de la conmutación por error" .
La compatibilidad regional con discos persistentes para la configuración de alta disponibilidad de Cloud SQL con al menos una CPU dedicada ofrece cobertura completa del Acuerdo de Nivel de Servicio (SLA) . Una instancia configurada para alta disponibilidad cuesta el doble que una instancia independiente. Este precio incluye CPU, RAM y almacenamiento. Para más información, consulte la página de precios .
* Para obtener más información sobre consideraciones específicas de cada región, consulte Geografía y regiones .
Leer réplicas
Si la disponibilidad es un factor importante para sus réplicas de lectura, puede habilitar la alta disponibilidad (HA) en ellas. Al convertir una réplica en instancia principal, ya estará configurada como instancia de alta disponibilidad.
Durante una interrupción zonal, el tráfico a las réplicas de lectura de esa zona se detiene. Una vez que la zona vuelve a estar disponible, las réplicas de lectura de la zona reanudan la replicación desde la instancia principal. Si las réplicas de lectura no se encuentran en una zona que sufre una interrupción, se conectan a la instancia en espera cuando esta se convierte en la instancia principal.
Como práctica recomendada, considere colocar algunas de sus réplicas de lectura en una zona distinta a la de las instancias principal y de reserva. Por ejemplo, si tiene una instancia principal en la zona A y una instancia de reserva en la zona B, coloque una réplica de lectura en la zona C para mejorar la confiabilidad. Esta práctica garantiza que las réplicas de lectura sigan funcionando incluso si la zona de la instancia principal deja de funcionar. También debería agregar lógica de negocio en la aplicación cliente para enviar lecturas a la instancia principal cuando las réplicas de lectura no estén disponibles.
Descripción general de la conmutación por error
Si una instancia configurada para alta disponibilidad deja de responder, Cloud SQL pasa automáticamente a servir datos desde la instancia en espera. Para comprobar si se ha producido una conmutación por error, consulte el historial de conmutación por error del registro de operaciones .
Obtenga más información sobre cómo crear consultas en el Explorador de registros . Si necesita información más detallada sobre una operación, como el usuario que la realizó, debe habilitar el registro de auditoría .
Haga clic en las pestañas para ver cómo la conmutación por error afecta su instancia.
Normal
Conmutación por error
Post-conmutación por error
Recuperación por recuperación
Proceso
Se produce el siguiente proceso:
La instancia o zona principal falla.
Cada segundo, el sistema de latidos detecta si la instancia principal está en buen estado. Si no se detectan varios latidos, se inicia la conmutación por error.
La instancia en espera ahora sirve datos al reconectarse.
A través de una dirección IP estática compartida con la instancia principal, la instancia en espera ahora sirve datos de la zona secundaria.
Requisitos
Para que Cloud SQL permita una conmutación por error, la configuración debe cumplir los siguientes requisitos:
- La instancia principal debe estar en un estado operativo normal (no detenida, en mantenimiento o realizando una operación de instancia de Cloud SQL de larga duración, como una operación de respaldo).
- Tanto la zona secundaria como la instancia en espera deben estar en buen estado. Si la instancia en espera no responde, se bloquean las operaciones de conmutación por error. Una vez que Cloud SQL repara la instancia en espera y la zona secundaria está disponible, Cloud SQL permite la conmutación por error.
Copia de seguridad y restauración
Las copias de seguridad automatizadas son muy recomendables para lograr una alta disponibilidad.
Aplicaciones e instancias
No hay diferencia entre trabajar con instancias con y sin alta disponibilidad, por lo que no es necesario configurar la aplicación. Al producirse una conmutación por error, se cierran las conexiones existentes con la instancia principal y las réplicas de lectura, y el restablecimiento de las conexiones con la instancia principal demora aproximadamente 60 segundos. La aplicación se reconecta utilizando la misma cadena de conexión o dirección IP, por lo que no es necesario actualizarla después de la conmutación por error.
Para ver exactamente cómo se ven afectadas sus aplicaciones por la conmutación por error, inicie la conmutación por error manualmente .
Tiempo de inactividad por mantenimiento
Los eventos de mantenimiento afectan a las instancias principales configuradas con alta disponibilidad (HA) de la misma manera que a otras instancias. Es posible que las instancias principales estén inactivas durante un breve periodo. Para obtener más información sobre cómo el mantenimiento afecta a las instancias de alta disponibilidad (HA), consulte Cómo funciona el mantenimiento . Para minimizar el impacto en su servicio, modifique la configuración de mantenimiento para controlar cuándo se produce el tiempo de inactividad.
¿Qué sigue?
- Habilitar y deshabilitar la alta disponibilidad en una instancia .
- Iniciar conmutación por error .
- Obtenga más información sobre cómo administrar sus conexiones de base de datos .
- Obtenga más información sobre las regiones y zonas en Cloud SQL.