Re: COPY FROM

From: Horacio Miranda <hmiranda(at)gmail(dot)com>
To: Guillermo Villanueva <guillermovil(at)gmail(dot)com>
Cc: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: COPY FROM
Date: 2010-06-01 23:06:42
Message-ID: AANLkTin36UmW7v3rmSR9_SYpox0Riq7rI12YX82LHCV-@mail.gmail.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Hola, disculpa por no ver este mensaje antes, creo que lo mejor es
filtrar antes de procesar, si usas windows, y no quieres usar
herramientas linux sobre un linux (por que usas windows) te sugiero
usar una herramienta linux en tu windows, PERL
http://www.tanguay.info/web2008/tutorial.php?idCode=installPerl

Dale una vuelta, en lo personal me gusta filtrar antes de procesar,
perl como todo lenjuage de script es mas lento que un programa en C,
pero la pobrabilidada de programar algo en C y que sea tan rapido como
un script en perl creo que es baja (pero como todo puedo estar
equivocado). Dale una vuelta y me cuentas. Otra alternativa es usar
excel para filtrar, pero por la cantidad de filas y como es un proceso
repetitivo, creo que la mejor opcion es perl o script de microsoft,
windows vista, 7 y windows 2008, tienen un motor de script decente
(comparado con lo anterior). No soy experto en script de Windows, pero
me imagino que se podra hacer algo similar, pero perl para windows se
que funcionara.

2010/5/29 Guillermo Villanueva <guillermovil(at)gmail(dot)com>:
> Hola gente, cómo están?
> Quería saber si hay alguna posibilidad de filtrar (horizontal y
> verticalmente) los datos de un .TXT muuuuy grande al copiarlos con COPY. De
> unas 360mil líneas hay unas 120mil que no quiero copiar (puedo detectarlas
> por un valor de columna), y hay dos columnas que tampoco quiero.
> Voy a tener que hacer el copy completo a una tabla intermedia y después otro
> de tabla a tabla ?
>
>
> ¿Recomiendan el uso de tablas particionadas para manejar tablas que crecen
> al mes unas 200mil tuplas (una vez al mes se agregan en batch)?
> Desde ya muchas gracias.
> Guillermo

--
Saludos,
Horacio Miranda Aguilera.
RedHat Certified Engineer
DBA Oracle - Large databases

In response to

  • COPY FROM at 2010-05-28 14:34:43 from Guillermo Villanueva

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Horacio Miranda 2010-06-01 23:33:29 Re: trabajo con cadenas
Previous Message Marco Antonio Sanchez 2010-06-01 23:06:32 Conexion postgres se desconecta