Utilice información del sistema para mejorar el rendimiento del sistema

Esta página describe cómo usar el panel de información del sistema de Cloud SQL. Este panel muestra métricas de los recursos que usa su instancia y le ayuda a detectar y analizar problemas de rendimiento del sistema.

Puede usar la asistencia de Gemini en Bases de Datos para observar y solucionar problemas de sus recursos de Cloud SQL para PostgreSQL. Para obtener más información, consulte Observar y solucionar problemas con la asistencia de Gemini .

Ver el panel de información del sistema

Para ver el panel de información del sistema, haga lo siguiente:

  1. En el Google Cloud consola, vaya a la página Instancias de Cloud SQL .

    Ir a Instancias de Cloud SQL

  2. Haga clic en el nombre de una instancia.
  3. Seleccione la pestaña Información del sistema en el panel de navegación de SQL a la izquierda.

Se abre el panel de información del sistema.

Imagen del tablero que muestra la línea de tiempo de eventos y tarjetas de resumen de métricas.
Figura 1. Imagen del tablero que muestra la línea de tiempo de eventos y tarjetas de resumen.

Imagen del tablero que muestra gráficos de métricas clave.
Figura 2. Imagen del tablero que muestra gráficos de métricas para métricas clave.

El panel de información del sistema muestra la siguiente información:

  1. Detalles de su instancia

  2. Cronología de eventos : muestra los eventos del sistema en orden cronológico. Esta información ayuda a evaluar el impacto de los eventos del sistema en el estado y el rendimiento de la instancia.

  3. Tarjetas de resumen : brindan una descripción general del estado y el rendimiento de la instancia al mostrar los valores más recientes y agregados para las métricas de utilización de CPU, utilización de disco y errores de registro.

  4. Gráficos de métricas : muestran información sobre el sistema operativo y las métricas de la base de datos que le ayudan a obtener información sobre varios temas, como el rendimiento, la latencia y el costo.

El panel de control ofrece las siguientes opciones de alto nivel:

  • Para ver uno o dos gráficos por fila, haga clic en "Personalizar vista" para elegir cómo se muestran estos gráficos. También puede usar esta opción para seleccionar las métricas que desea mostrar en el panel.
  • Para mantener el panel de control actualizado, habilite la Opción de actualización automática . Al activar la actualización automática , los datos del panel se actualizan cada minuto. Esta función no es compatible con periodos de tiempo personalizados.

  • El selector de tiempo muestra 1 day seleccionado por defecto. Para cambiar el período, seleccione uno de los otros períodos predefinidos o haga clic en "Personalizar" y defina una hora de inicio y una de fin. Los datos están disponibles para los últimos 30 días.

  • Para crear un enlace absoluto al panel, haga clic en el botón "Copiar enlace" . Puede compartir este enlace con otros usuarios de Cloud SQL que tengan los mismos permisos.

  • Para crear una alerta para un evento específico, haga clic en Notificación .

  • Para mostrar alertas específicas, haga clic en Anotaciones .

Tarjetas de resumen

La siguiente tabla describe las tarjetas de resumen que se muestran en la parte superior del panel de información del sistema. Estas tarjetas ofrecen una breve descripción general del estado y el rendimiento de la instancia durante el período seleccionado.

Tarjeta de resumen Descripción
Utilización de la CPU - P99 | P50 Los valores de utilización de la CPU P99 y P50 durante el período seleccionado.
Conexiones de pico La relación entre las conexiones pico y el máximo de conexiones para el período seleccionado. El número máximo de conexiones podría ser mayor que el máximo si este ha cambiado recientemente, por ejemplo, debido al escalado de la instancia o a un cambio manual en la configuración de max_connections .
Utilización del ID de transacción El último valor de utilización del ID de transacción para el período seleccionado.
Utilización del disco El último valor de utilización del disco.
Errores de registro La cantidad de errores que registran los usuarios.

Gráficos de métricas

A continuación se muestra una tarjeta gráfica con una métrica de muestra.

Gráfico que muestra datos de métricas de Cloud SQL de muestra.
Gráfico de métricas que muestra métricas de latencia de consulta.

La barra de herramientas de cada tarjeta de gráfico proporciona el siguiente conjunto de opciones estándar:

  • Para ver los valores métricos de un momento específico en el período seleccionado, mueva el cursor sobre el gráfico.

  • Para ampliar un gráfico, haga clic en él y arrástrelo horizontalmente por el eje X o verticalmente por el eje Y. Para revertir la operación de zoom, haga clic en Restablecer zoom . O bien, haga clic en uno de los periodos predefinidos en la parte superior del panel. Las operaciones de zoom se aplican simultáneamente a todos los gráficos del panel.

  • Para ver más opciones, haga clic en Más opciones de gráficos . La mayoría de los gráficos ofrecen estas opciones:

    • Para ver un gráfico en pantalla completa, haga clic en Ver en pantalla completa . Para salir del modo de pantalla completa, haga clic en Cancelar .

    • Ocultar o contraer la leyenda.

    • Descargue un archivo PNG o CSV del gráfico.

    • Ver en el Explorador de Métricas . Ver la métrica en el Explorador de Métricas . Puede ver otras métricas de Cloud SQL en el Explorador de Métricas después de seleccionar el tipo de recurso de la base de datos de Cloud SQL .

  • Para crear un panel personalizado, haz clic panel y asígnale un nombre. O bien, expande el menú Predefinidos y selecciona un panel personalizado existente.

  • Para ver los datos de un gráfico de métricas en detalle, haga clic en Explorar datos . Aquí puede filtrar métricas específicas y elegir cómo se muestra el gráfico:

    Vista personalizable de datos métricos de Cloud SQL.

    Para guardar esta vista personalizada como un gráfico de métricas, haga clic en Guardar en el panel .

Métricas predeterminadas

La siguiente tabla describe las métricas de Cloud SQL que aparecen de forma predeterminada en el panel de información del sistema Cloud SQL.

Las cadenas de tipo métrico siguen este prefijo: cloudsql.googleapis.com/database/ .

Para conocer la disponibilidad de la última etapa de lanzamiento de las siguientes métricas, consulte Google Cloud métricas .

Nombre y tipo de métrica Descripción
Nuevas conexiones por segundo
postgresql/new_connection_count

La tasa de nuevas conexiones que creas en tu instancia de Cloud SQL para PostgreSQL, por segundo. Cloud SQL calcula y muestra esta métrica por base de datos.

Esta métrica está disponible para PostgreSQL versión 14 y posteriores.

Tipos de eventos de espera
postgresql/backends_in_wait

La cantidad de conexiones para cada tipo de evento de espera en una instancia de Cloud SQL para PostgreSQL.

Eventos de espera
postgresql/backends_in_wait

Número de eventos de espera en una instancia de Cloud SQL para PostgreSQL. El panel muestra esta métrica como nombre del evento de espera : tipo de evento de espera .

Recuento de transacciones
postgresql/transaction_count

La cantidad de transacciones en los estados de commit y rollback en una instancia de Cloud SQL para PostgreSQL.

Componentes de la memoria
memory/components

Los componentes de memoria disponibles para la base de datos. El valor de cada componente de memoria se calcula como el porcentaje de la memoria total disponible para la base de datos.

Retraso máximo de bytes de réplica
postgresql/external_sync/max_replica_byte_lag

El retraso máximo de replicación (en bytes) entre todas las bases de datos en la réplica del servidor externo (ES).

Latencia de consulta
postgresql/insights/aggregate/latencies

Distribución de latencia de consulta agregada por P99, P95 y P50 por usuario y base de datos.

Solo disponible para instancias con información de consultas habilitada.

Carga de base de datos por dirección de base de datos/usuario/cliente
postgresql/insights/aggregate/execution_time

El tiempo acumulado de ejecución de consultas por base de datos, usuario o dirección de cliente. Es la suma del tiempo de CPU, el tiempo de espera de E/S, el tiempo de espera de bloqueo, el cambio de contexto del proceso y la programación de todos los procesos involucrados en la ejecución de consultas.

Solo disponible para instancias con información de consultas habilitada.

Utilización de la CPU
cpu/utilization

La utilización actual de la CPU representada como un porcentaje de la CPU reservada que está actualmente en uso.

Almacenamiento en disco por tipo
disk/bytes_used_by_data_type

El desglose del uso del disco de instancia por tipos de datos, incluidos data , binlog y tmp_data .

Esta métrica le ayuda a comprender sus costos de almacenamiento. Para obtener más información sobre los cargos por uso de almacenamiento, consulte Precios de almacenamiento y redes .

La recuperación a un punto en el tiempo (PITR) utiliza el archivado de registros de escritura anticipada (WAL). Estos registros se actualizan periódicamente y ocupan espacio de almacenamiento. Los registros de escritura anticipada se eliminan automáticamente con su copia de seguridad automática asociada, lo que suele ocurrir después de unos 7 días.

Si el tamaño de los registros de escritura anticipada está causando problemas en su instancia, puede aumentar el tamaño de almacenamiento, pero el aumento en el uso del disco debido a estos registros podría ser temporal. Para evitar problemas de almacenamiento inesperados, Google recomienda habilitar el aumento automático del almacenamiento al usar PITR.

Para eliminar los registros y recuperar el almacenamiento, puede deshabilitar la recuperación a un momento dado. Sin embargo, tenga en cuenta que reducir el almacenamiento utilizado no reduce el tamaño del almacenamiento aprovisionado para la instancia.

Los datos temporales se incluyen en la métrica de uso del almacenamiento. Estos datos se eliminan como parte del mantenimiento y se permite que aumenten más allá de los límites de capacidad definidos por el usuario para evitar un evento de disco lleno, sin costo alguno para el usuario.

Una base de datos recién creada utiliza aproximadamente 100 MB para tablas y archivos del sistema.

Almacenamiento en disco por tipo
disk/bytes_used_by_data_type

El desglose del uso del disco de instancia por tipos de datos, incluidos data , binlog y tmp_data .

Esta métrica le ayuda a comprender sus costos de almacenamiento. Para obtener más información sobre los cargos por uso de almacenamiento, consulte Precios de almacenamiento y redes .

La recuperación a un punto en el tiempo utiliza el archivado de registro de escritura anticipada (WAL) . En las nuevas instancias de Cloud SQL que tengan habilitada la recuperación a un punto en el tiempo, o en las instancias existentes que la permitan después de que esta función para almacenar registros WAL en Cloud Storage esté disponible, los registros ya no se almacenarán en disco, sino en Cloud Storage , en la misma región que las instancias.

Para comprobar si los registros de una instancia se almacenan en Cloud Storage, consulte la métrica bytes_used_by_data_type de la instancia. Si el valor del tipo de dato archived_wal_log es 0 , los registros de la instancia se almacenan en Cloud Storage.

Todas las demás instancias existentes con la recuperación a un momento dado habilitada seguirán almacenando sus registros en disco. El cambio al almacenamiento de registros en Cloud Storage estará disponible más adelante.

Los registros de escritura anticipada utilizados en la recuperación a un momento dado se eliminan automáticamente junto con su copia de seguridad automática asociada, lo que generalmente ocurre después de alcanzar el valor establecido en transactionLogRetentionDays . Este es el número de días de registros de transacciones que Cloud SQL conserva para la recuperación a un momento dado, de 1 a 7.

En las instancias con registros de escritura anticipada almacenados en Cloud Storage, estos se almacenan en la misma región que la instancia principal. Este almacenamiento de registros (hasta siete días, la duración máxima para la recuperación en un momento dado) no genera ningún coste adicional por instancia.

Si su instancia tiene habilitada la recuperación a un momento dado y el tamaño de los registros de escritura anticipada en el disco le está causando un problema, deshabilítela y vuelva a habilitarla para garantizar que los nuevos registros se almacenen en Cloud Storage, en la misma región que la instancia. Esto elimina los registros de escritura anticipada existentes, por lo que no podrá realizar una restauración a un momento dado antes de que haya reactivado la recuperación. Sin embargo, aunque se eliminen los registros existentes, el tamaño del disco permanece igual.

Para evitar problemas de almacenamiento inesperados, recomendamos habilitar el aumento automático del almacenamiento en todas las instancias al usar la recuperación a un momento dado. Esta recomendación solo aplica si su instancia tiene habilitada la recuperación a un momento dado y sus registros están almacenados en disco.

Para eliminar los registros y recuperar almacenamiento, puede deshabilitar la recuperación a un momento dado. Sin embargo, tenga en cuenta que reducir los registros de escritura anticipada utilizados no reduce el tamaño del disco aprovisionado para la instancia.

Los datos temporales se incluyen en la métrica de uso del almacenamiento. Estos datos se eliminan como parte del mantenimiento y se permite que aumenten más allá de los límites de capacidad definidos por el usuario para evitar un evento de disco lleno, sin costo alguno para el usuario.

Una base de datos recién creada utiliza aproximadamente 100 MB para tablas y archivos del sistema.

Operaciones de lectura y escritura de disco
disk/read_ops_count , disk/write_ops_count

La métrica "Número de lecturas" indica la cantidad de operaciones de lectura atendidas desde el disco que no provienen de la caché. Puede usar esta métrica para comprender si su instancia tiene el tamaño correcto para su entorno. Si es necesario, puede cambiar a un tipo de máquina más grande para atender más solicitudes desde la caché y reducir la latencia.

La métrica "Número de escrituras" indica la cantidad de operaciones de escritura en el disco. La actividad de escritura se genera incluso si la aplicación no está activa, ya que las instancias de Cloud SQL, salvo las réplicas, escriben en una tabla del sistema aproximadamente cada segundo.

Conexiones por estado
postgresql/num_backends_by_state

La cantidad de conexiones agrupadas por estos estados: idle , active , idle_in_transaction , idle_in_transaction_aborted , disabled y fastpath_function_call .

Para obtener información sobre estos estados, consulte la fila state text en la documentación de pg_stat_activity .

Conexiones por base de datos
postgresql/num_backends

El número de conexiones mantenidas por la instancia de base de datos.

Bytes de entrada/salida
network/received_bytes_count , network/sent_bytes_count

El tráfico de red en términos de la cantidad de bytes de ingreso (bytes recibidos) y bytes de egreso (bytes enviados) hacia y desde la instancia, respectivamente.

Desglose de espera de E/S por tipo
postgresql/insights/aggregate/io_time

El desglose del tiempo de espera de E/S para declaraciones SQL por tipos de lectura y escritura.

Solo disponible para instancias con información de consultas habilitada.

Recuento de bloqueos por base de datos
postgresql/deadlock_count

El número de bloqueos por base de datos.

Recuento de lecturas de bloques
postgresql/blocks_read_count

La cantidad de bloques leídos por segundo desde el disco y desde la memoria caché del búfer.

Filas procesadas por operación
postgresql/tuples_processed_count

El número de filas procesadas por operación por segundo.

Filas en la base de datos por estado
postgresql/tuple_size

Número de filas para cada estado de base de datos. Cloud SQL informa esta métrica si el número de bases de datos en la instancia es inferior a 50.

Transacción más antigua por antigüedad
postgresql/vacuum/oldest_transaction_age

La edad de la transacción más antigua que está bloqueando la operación de vacío.

Archivado WAL
replication/log_archive_success_count , replication/log_archive_failure_count

La cantidad de archivos de registro de escritura anticipada que se archivaron con éxito o sin éxito por minuto.

Utilización del ID de transacción
postgresql/transaction_id_utilization

El porcentaje de identificadores de transacción utilizados en la instancia.

Recuento de conexiones por nombre de aplicación
postgresql/num_backends_by_application

La cantidad de conexiones a la instancia de Cloud SQL, agrupadas por aplicaciones.

Las conexiones sin un nombre de aplicación se agrupan como Unknown .

Filas obtenidas vs. filas devueltas vs. filas escritas
  • Filas obtenidas: postgresql/tuples_fetched_count
  • Filas devueltas: postgresql/tuples_returned_count
  • Filas escritas: postgresql/tuples_processed_count
  • Filas obtenidas es la cantidad de filas obtenidas como resultado de consultas en la instancia.
  • Las filas devueltas son el número de filas escaneadas mientras se procesan las consultas en la instancia.
  • Filas escritas es la cantidad de filas escritas en la instancia mientras se realizan operaciones de inserción, actualización y eliminación.

Si la diferencia entre las filas devueltas y las filas obtenidas es tan grande que sus valores no se muestran en la misma escala, entonces el valor de las filas obtenidas se muestra como 0 porque es insignificante en comparación con el valor de las filas devueltas.

Tamaño de los datos temporales
postgresql/temp_bytes_written_count

La cantidad total de datos (en bytes) utilizada para la ejecución de consultas y la realización de algoritmos como unión y ordenación.

Archivos temporales
postgresql/temp_files_written_count

La cantidad de archivos temporales utilizados para la ejecución de consultas y la realización de algoritmos como unión y ordenación.

Además, la métrica de Cloud Logging, Entradas de registro por gravedad ( logging.googleapis.com/log_entry_count ), muestra la cantidad total de entradas de registro de errores y advertencias.

Estos se extraen de postgres.log , que es el registro de la base de datos, y pgaudit.log , que contiene información de acceso a los datos.

Para obtener más información, consulte Métricas de Cloud SQL .

Cronología de eventos

El panel de control proporciona los detalles de los siguientes eventos:

Nombre del evento Descripción Tipo de operación
Instance restart Reinicia la instancia de Cloud SQL RESTART
Instance failover Inicia una conmutación por error manual de una instancia principal de alta disponibilidad (HA) a una instancia en espera, que se convierte en la instancia principal. FAILOVER
Instance maintenance Indica que la instancia se encuentra actualmente en mantenimiento. El mantenimiento suele provocar que la instancia no esté disponible durante 1 a 3 minutos. MAINTENANCE
Instance backup Realiza una copia de seguridad de una instancia. BACKUP_VOLUME
Instance update Actualiza la configuración de una instancia de Cloud SQL. UPDATE
Promote replica Promueve una instancia de réplica de Cloud SQL. PROMOTE_REPLICA
Start replica Inicia la replicación en una instancia de réplica de lectura de Cloud SQL. START_REPLICA
Stop replica Detiene la replicación en una instancia de réplica de lectura de Cloud SQL. STOP_REPLICA
Recreate replica Recrea recursos para una instancia de réplica de Cloud SQL. RECREATE_REPLICA
Create replica Crea una instancia de réplica de Cloud SQL. CREATE_REPLICA
Data import Importa datos a una instancia de Cloud SQL. IMPORT
Instance export Exporta datos de una instancia de Cloud SQL a un depósito de Cloud Storage. EXPORT
Restore backup Restaura una copia de seguridad de una instancia de Cloud SQL. Esta operación podría provocar el reinicio de la instancia. RESTORE_VOLUME

¿Qué sigue?