RE: Uso system de CPU

From: Armando Venegas Pérez <venegasp_armando(at)hotmail(dot)com>
To: "pgsql-es-ayuda(at)postgresql(dot)org" <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: RE: Uso system de CPU
Date: 2012-09-10 14:48:01
Message-ID: BAY164-W97495A6C9ABE4A84E61BAF7AC0@phx.gbl
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Hola Cesár.

A mi me paso algo similar, pero el problema era un proceso que corría por CRON y se nos había olvidado.

Tal vez no sea tu caso, pero por si las dudas.

Saludos

Date: Mon, 10 Sep 2012 11:30:41 +0200
Subject: [pgsql-es-ayuda] Uso system de CPU
From: cmartinp(at)gmail(dot)com
To: pgsql-es-ayuda(at)postgresql(dot)org

Buenos días,
Tengo un servidor postgres 8.3 con la siguiente configuración HW:
128GB de RAM2 procesadores AMD Opteron 6282 con 16 cores cada uno2 controladoras Raid con 1GB de memoria

h700: Raid1(sistema), Raid10 4HD(xlog)
h800: Raid10 12HD (En cabina) (DB)

La DB tiene actualmente unos 250GB y lleva una aplicación web que se conecta mediante un PGPool en modo Pool de conexiones.

La configuracion actual de postgres es la siguiente:
max_connections = 500 (aunque desde el pgpool las limito a 400) unix_socket_directory = '/var/run/postgres'

shared_buffers = 12GB work_mem = 6MB maintenance_work_mem = 1GB

max_fsm_pages = 8553600 max_fsm_relations = 409000 fsync = on

synchronous_commit = off wal_buffers = 8MB checkpoint_segments = 32

checkpoint_completion_target = 0.9 effective_cache_size = 100GBconstraint_exclusion = onmax_locks_per_transaction = 100

Hace algunas semanas, la DB, de repente, empezó a ir lentísima y generar cientos de timeouts a la hora de conectar el frontal web. Las carga de trabajo de la DB era ridícula comparada con la normal (al ser el mes de Agosto) y sin embargo las queries iban muy lentas.

La carga del servidor subía hasta llegar a 300 y las cpu corrían al 100% con carga tipo system o kernel, sin embargo a nivel de disco en ambos volumenes la carga de I/O no superaba las 100 IOPS.

Este problema persistió durante todas las mañanas, hasta el punto de hacerme reiniciar la BBDD a diario... en un solo día llegue a reiniciarla hasta 4 veces, hasta que un día, puesto que no encontraba la solución, reinicie el servidor y parece que el problema se ha mitigado durante mas o menos unos diez días, ya que el otro día repitió el mismo patrón de comportamiento.

He analizado los logs en busca de alguna query conflictiva, pero no hay ninguna que pueda provocar un bloqueo así. Ademas en otros casos cuando ha sido provocado por una consulta, lo que subía era el acceso a disco y la carga del servidor era de tipo "IO wait" no de tipo System.
Los logs de sistema tampoco dan ningún error de kernel.
La Swap, tampoco se esta usando, ya que el swappines del proc esta a 0.
A alguien le ha pasado algo similar?? Se os ocurre que puede estar pasando?? Algún problema HW??

No duden en pedirme cualquier datos necesario.Muchas gracias de antemano, un saludo.
--

César Martín Pérez
cmartinp(at)gmail(dot)com

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Edwin Quijada 2012-09-10 15:40:00 RE: Problema con Zona horaria
Previous Message zahory 2012-09-10 14:42:15 Re: Problema con Zona horaria