From: | Horacio Miranda <hmiranda(at)gmail(dot)com> |
---|---|
To: | Guillermo Villanueva <guillermovil(at)gmail(dot)com> |
Cc: | pgsql-es-ayuda(at)postgresql(dot)org |
Subject: | Re: COPY FROM |
Date: | 2010-06-01 23:06:42 |
Message-ID: | AANLkTin36UmW7v3rmSR9_SYpox0Riq7rI12YX82LHCV-@mail.gmail.com |
Views: | Raw Message | Whole Thread | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-es-ayuda |
Hola, disculpa por no ver este mensaje antes, creo que lo mejor es
filtrar antes de procesar, si usas windows, y no quieres usar
herramientas linux sobre un linux (por que usas windows) te sugiero
usar una herramienta linux en tu windows, PERL
http://www.tanguay.info/web2008/tutorial.php?idCode=installPerl
Dale una vuelta, en lo personal me gusta filtrar antes de procesar,
perl como todo lenjuage de script es mas lento que un programa en C,
pero la pobrabilidada de programar algo en C y que sea tan rapido como
un script en perl creo que es baja (pero como todo puedo estar
equivocado). Dale una vuelta y me cuentas. Otra alternativa es usar
excel para filtrar, pero por la cantidad de filas y como es un proceso
repetitivo, creo que la mejor opcion es perl o script de microsoft,
windows vista, 7 y windows 2008, tienen un motor de script decente
(comparado con lo anterior). No soy experto en script de Windows, pero
me imagino que se podra hacer algo similar, pero perl para windows se
que funcionara.
2010/5/29 Guillermo Villanueva <guillermovil(at)gmail(dot)com>:
> Hola gente, cómo están?
> Quería saber si hay alguna posibilidad de filtrar (horizontal y
> verticalmente) los datos de un .TXT muuuuy grande al copiarlos con COPY. De
> unas 360mil líneas hay unas 120mil que no quiero copiar (puedo detectarlas
> por un valor de columna), y hay dos columnas que tampoco quiero.
> Voy a tener que hacer el copy completo a una tabla intermedia y después otro
> de tabla a tabla ?
>
>
> ¿Recomiendan el uso de tablas particionadas para manejar tablas que crecen
> al mes unas 200mil tuplas (una vez al mes se agregan en batch)?
> Desde ya muchas gracias.
> Guillermo
--
Saludos,
Horacio Miranda Aguilera.
RedHat Certified Engineer
DBA Oracle - Large databases
From | Date | Subject | |
---|---|---|---|
Next Message | Horacio Miranda | 2010-06-01 23:33:29 | Re: trabajo con cadenas |
Previous Message | Marco Antonio Sanchez | 2010-06-01 23:06:32 | Conexion postgres se desconecta |