Re: Repetidos errores en un servidor

From: Martín Marqués <martin(dot)marques(at)gmail(dot)com>
To: Rodriguez Fernando <rodriguez(at)ort(dot)edu(dot)uy>
Cc: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: Repetidos errores en un servidor
Date: 2010-11-25 11:10:14
Message-ID: AANLkTikBovtxnTWwJ4y8obxkoj8o_Ue08UydTuJ5n5nG@mail.gmail.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Agregue 1Gb de swap y el pg_dump anduvo. Se morfo casi la mitad del swap.

Lo del dump no era lo mas grave, ya que es un servidor de desarrollo,
pero la semana pasada el kernel mandaba el OOM-kill al proceso
postmaster, con lo cual ya solo quedaba reiniciar el postgres.

El día 25 de noviembre de 2010 07:20, Rodriguez Fernando
<rodriguez(at)ort(dot)edu(dot)uy> escribió:
> El 24/11/2010 18:38, Martín Marqués escribió:
>>
>> Buenas,
>>
>> Ultimamente me estoy encontrando con repetidos errores en un servidor
>> PostgreSQL 8.4.5 que usamos para desarrollo (de ahi que recien me
>> pongo a ver que es lo que le esta sucediendo). Cada tanto o se cae el
>> servidor o mueren procesos del postmaster.
>>
>> Por ejemplo, en el backup de ayer me llego esto en los reportes:
>>
>> pg_dump: Falló la extracción del contenido de la tabla
>> «novedades_fotos»: PQgetCopyData() falló.
>> pg_dump: Mensaje de error del servidor: el servidor ha cerrado la
>> conexión inesperadamente
>>        Probablemente se debe a que el servidor terminó de manera anormal
>>        antes o durante el procesamiento de la petición.
>>
>> Buscando el los logs encuentro esto:
>>
>> 2010-11-23 21:15:17 ART - siprebi: LOG:  sentencia: COPY
>> biblioteca.novedades_fotos (codigo, foto) TO stdout;
>> 2010-11-23 21:15:30 ART - : LOG:  proceso background writer (PID 8917)
>> fue terminado por una se?al 9: Killed
>> 2010-11-23 21:15:34 ART - : LOG:  terminando todos los otros procesos
>> de servidor activos
>> 2010-11-23 21:15:35 ART - postgres: WARNING:  terminando la conexión
>> debido a una falla en otro proceso servidor
>> 2010-11-23 21:15:35 ART - postgres: DETALLE:  Postmaster ha ordenado
>> que este proceso servidor cancele la transacción en curso y finalice
>> la conexión, porque otro proceso servidor ha terminado anormalmente y
>> podría haber corrompido la memoria compartida.
>> 2010-11-23 21:15:35 ART - postgres: HINT:  Dentro de un momento
>> debería poder reconectarse y repetir la consulta.
>> 2010-11-23 21:15:35 ART - : WARNING:  terminando la conexi?n debido a
>> una falla en otro proceso servidor
>> 2010-11-23 21:15:35 ART - : DETALLE:  Postmaster ha ordenado que este
>> proceso servidor cancele la transacci?n en curso y finalice la
>> conexi?n, porque otro proceso servidor ha terminado anormalmente y
>> podr?a haber corrompido la memoria compartida.
>> 2010-11-23 21:15:35 ART - : HINT:  Dentro de un momento deber?a poder
>> reconectarse y repetir la consulta.
>> 2010-11-23 21:15:35 ART - siprebi: WARNING:  terminando la conexión
>> debido a una falla en otro proceso servidor
>> 2010-11-23 21:15:35 ART - siprebi: DETALLE:  Postmaster ha ordenado
>> que este proceso servidor cancele la transacción en curso y finalice
>> la conexión, porque otro proceso servidor ha terminado anormalmente y
>> podría haber corrompido la memoria compartida.
>> 2010-11-23 21:15:35 ART - siprebi: HINT:  Dentro de un momento debería
>> poder reconectarse y repetir la consulta.
>> 2010-11-23 21:15:35 ART - siprebi: SENTENCIA:  COPY
>> biblioteca.novedades_fotos (codigo, foto) TO stdout;
>> 2010-11-23 21:15:36 ART - : LOG:  proceso de archivado (PID 8920)
>> termin? con c?digo de salida 1
>> 2010-11-23 21:15:36 ART - : LOG:  todos los procesos fueron
>> terminados; reinicializando
>> 2010-11-23 21:15:38 ART - : LOG:  el sistema de bases de datos fue
>> interrumpido; ?ltima vez en funcionamiento en 2010-11-23 21:11:19 ART
>> 2010-11-23 21:15:38 ART - : LOG:  el sistema de bases de datos no fue
>> apagado apropiadamente; se est? efectuando la recuperaci?n autom?tica
>> 2010-11-23 21:15:39 ART - : LOG:  registro de longitud cero en 5/1C08331C
>> 2010-11-23 21:15:39 ART - : LOG:  no se requiere redo
>> 2010-11-23 21:15:41 ART - : LOG:  el sistema de bases de datos est?
>> listo para aceptar conexiones
>> 2010-11-23 21:15:41 ART - : LOG:  lanzador de autovacuum iniciado
>>
>> Que fue lo que paso aca?
>>
> Hola, proba hacer un  vacuum de la base.
> luego tira el pg_dump -Ft, tenes  objetos binarios en la base?
> Alguien tiene acceso a alguna herramienta que pueda matar procesos?
>
>
> Saludos Fernando
> -
> Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda(at)postgresql(dot)org)
> Para cambiar tu suscripción:
> http://www.postgresql.org/mailpref/pgsql-es-ayuda
>

--
Martín Marqués
select 'martin.marques' || '@' || 'gmail.com'
DBA, Programador, Administrador

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Alvaro Herrera 2010-11-25 12:37:27 Re: incoherencia
Previous Message Rodriguez Fernando 2010-11-25 10:20:50 Re: Repetidos errores en un servidor