Re: Problema de replica lógica entre postgres

From: Horacio Miranda <hmiranda(at)gmail(dot)com>
To: Fernando Monjes <ing(dot)bovet(at)gmail(dot)com>
Cc: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: Problema de replica lógica entre postgres
Date: 2023-04-26 13:16:15
Message-ID: 8192b631-5f12-7a7b-ac93-75cfe535a0e3@gmail.com
Views: Whole Thread | Raw Message | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Me alegra que este andando todo mejor. muchas gracias por compartir la
información.

Recuerda que puedes mejorar un más las comunicaciones de los WAL cuando
usas compression en los canales.

Ahora un truco, la compression solo usa una CPU. para tener compression
con varios canales puedes hacer balanceo de carga con varios canalaes (
proxy reversos ).

-C ( para comprimir ) .

Ejemplo.

HA proxy (port 2222) ===== (port
2231,2232,2233,2234,2235,2236,2237,2238,2239) ( igualas la cantidad de
cpu ) y con esto tienes tantos canales como WAL en paralelo o streams
tengas, revisa los puertos usados al mismo tiempo ), debiera mejorar la
velocidad de transmissión). Se que algunos SDWAN hacen algo similar.

Hace la prueba de concepto y puede que te gusten los resultados.

Recuerda que estan las zonas locales en Chile con eso la latencia es
mucho menor.

Habilitar MTU 9000 en el enlace directo a AWS y con eso estas con todas
las mejoras que puedo imaginar.

A nivel de redes puedes hacer offload de los checksum.

No se me ocurre otra cosa que pueda mejorar tu velocidad.

On 27/04/2023 12:51 am, Fernando Monjes wrote:
> Hola Horacio.,
>
>               Te comento que finalmente encontramos la solución , y se
> debió al parámetro de Postgresql "logical_decoding_work_mem", si bien
> suena lógico modificarlo, solo después de un arduo trabajo de empezar
> a acotar llegamos que estaba muy bajo y lo aumentamos a 16GB y
> funcionaron los consumidores de la replicación sin problemas,
> te agradezco tu apoyo y si bien la solución estaba en pg, tus
> recomendación en el ámbito de networking ayudaron a mejorar y poner en
> la mesa varios temas que debemos abordar.
>
> Atte.,
>
>
> El mié, 19 abr 2023 a las 0:05, Horacio Miranda (<hmiranda(at)gmail(dot)com>)
> escribió:
>
>
>
>> On 19/04/2023, at 2:07 AM, Fernando Monjes <ing(dot)bovet(at)gmail(dot)com>
>> wrote:
>>
>> Hola Horacio , gracias por la respuesta y disposición de ayudar ,
>> estamos revisando con personal de redes lo que mencionas.,
>> de igual forma forma me interesa chequear que mi configuración de
>> replicación lógica este correcta, vi en este hilo
>> PostgreSQL: Re: Retraso de replicación debido al retraso
>> restart_lsn
>> <https://www.postgresql.org/message-id/CACG9ogw%2BNaq08%2BosrYxc-6Skbp3QMeQ6aZ2%3DmFcy5HJ1Hr2U0g%40mail.gmail.com> que
>> "el número máximo de cambios guardados en la memoria por
>> transacción es de 4 MB" esto me llama la atención es modificable,
>> se puede aumentar ?
> Depende de como estén replicando, pégale una mirada a esto.
>
> https://www.migops.com/blog/setting-up-streaming-replication-in-postgresql-13-and-streaming-replication-internals/
>
> Esto debiera decirte como vas con la replicación.
>
> psql -x -c "select * from pg_stat_replication"
>
>
>
>
>
>> y dejando el tema de red aun lado, cual seria un tunning de BD
>> correcto para soportar este escenario, que al recibir un aumento
>> de carga la replicación queda atrasada y no transmite los datos
>> (replicación lógica nativa), estoy con Postgresql versión 13.8
>
> Quieres que la replicación tenga un delay ? o tu pregunta esta
> relacionada a que esta atrazada y te interesa que este menos
> trasada ( casí syncronica ?)
>
>
>
>> Gracias
>>
>>
>>
>> El mar, 11 abr 2023 a las 18:34, Horacio Miranda
>> (<hmiranda(at)gmail(dot)com>) escribió:
>>
>>
>> En Amazon en tu security group activa el ICMP type 3 : type 4
>> asegúrate que el pmtud funciona. Desde tu máquina onPrem hace
>> un tracepath
>>
>> Si te entiendo bien el problema lo tienes cuando hay muchos
>> datos y algo pasa que deja de funcionar. Si es lo que
>> sospecho en AWS estas con MTU 9000 o en tu datacenter y como
>> PMTUD no esta activado por que los ICMP los bloquean los de
>> seguridad hay fragmentación esta fragmentación no es buena en
>> internet sobre todo si paquetes salen con flag DF que es no
>> fragmentar y los servidores terminan configurando un mss
>> mínimo maximo de 536 bytes. Si esto es complicado hay un par
>> de vídeos buenos que explican este tema. En palabras simples
>> hace que tracepath pmtud salga y vas a estar bien
>>
>> Regards,
>> Horacio Miranda
>>
>>
>>
>> > On 12/04/2023, at 9:57 AM, Fernando Monjes
>> <ing(dot)bovet(at)gmail(dot)com> wrote:
>> >
>> > 
>> > Hola Amigos
>> >
>> > Tengo un problema, estoy con una instancia amazon aws donde
>> tengo postgres v13.8 y onpremise un postgres 14.7, tengo
>> configurado una réplica lógica nativa de 4 tablas usando slot
>> plugin pgoutput, usando publicador en aws y subscriptor en
>> onpremise postgres , la bd en aws  tiene total de 30 tablas ,
>> el problema que ocurre es que en un estado de mucha carga a
>> las restantes tablas en aws, la réplica de las 4 tablas del
>> publicador deja de funcionar y no sigue transmitiendo datos,
>> esto hace que crezca el slot, siendo esto otro problema, pero
>> el punto es por que deja de transmitir datos. no se si
>> alguien ha tenido un problema similar
>> >
>> > --
>> > Gracias cualquier aporte
>> >
>> > Fernando Monjes B.
>> > Consultor DBA
>> > Cel: +56 9 7852 1024
>>
>>
>>
>> --
>> Atentamente,
>>
>>
>> Fernando Monjes B.
>> Consultor DBA
>> Ingeniero en Informática
>> Cel: 09 -78521024
>
>
>
> --
> Atentamente,
>
>
> Fernando Monjes B.
> Consultor DBA
> Ingeniero en Informática
> Cel: 09 -78521024

In response to

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Guillermo E. Villanueva 2023-05-05 14:29:50 de versión 8 a versión actual
Previous Message Fernando Monjes 2023-04-26 12:51:41 Re: Problema de replica lógica entre postgres