Busqueda de duplicados, con demora.

From: Gabriel Hermes Colina Zambra <hermeszambra(at)yahoo(dot)com>
To: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Busqueda de duplicados, con demora.
Date: 2007-06-01 03:21:53
Message-ID: 546227.28127.qm@web63711.mail.re1.yahoo.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Estimados amigos de la lista

Probe hacer una consulta a una tabla para buscar
duplicados de dos campos, id_articulo y id_proveedor
para identificar por cuales eran y borrarlos para
luego crear un indice unico sobre estos campos, la
tabla tiene la relacion del id de mi articulo con el
id del articulo en el proveedor y cuenta con 62000
registros, un poco mas.

Despues de una demora de 15 minutos, tome la solucion
de ver como lo resolvia access, para mi sorpresa lo
hizo en segundos, con esa respuesta genere una tabla y
vinculando la de postgresql, elimine los registros
duplicados resolviendo asi mi problema.

Ahora estoy por dormirme y resolvi mostrar la consulta
a la lista a ver si la puedo hacer de otra manera, no
muestro el explain analyze, puesto que ahora que estoy
acostado lo puse y todavia sigue procesando la
consulta.

SELECT central.articulo_proveedor.id_articulo,
central.articulo_proveedor.id_proveedor,
central.articulo_proveedor.id_en_proveedor,
central.articulo_proveedor.dto1,
central.articulo_proveedor.dto2,
central.articulo_proveedor.unidades_x_envase,
central.articulo_proveedor.id_imagen INTO dupartprov
FROM central.articulo_proveedor
WHERE (((central.articulo_proveedor.id_articulo) In
(SELECT id_articulo FROM central.articulo_proveedor As
Tmp GROUP BY id_articulo,id_proveedor HAVING
Count(*)>1 And id_proveedor =
central.articulo_proveedor.id_proveedor)))
ORDER BY central.articulo_proveedor.id_articulo,
central.articulo_proveedor.id_proveedor;

Puedo mostrar algo que me arroja el ems antes de
quedar dormido con la consulta y es lo siguiente

(cost=224.65..921.05 rows=7792 width=21)
Recheck Cond: (id_proveedor=$0)
-> Bitmap Index Scan on articulo_proveedor_idx1
(cost=0.00..222.70 rows=7792 width=0)
Index Cond: (id_proveedor=$0)

Tuve que copiarlo a mano, puesto que EMS igual que
psql siguen intentando terminar la tarea.

Despues de dormir me voy a fijar si la termino y les
mando el explain, mientras tanto, me gustaria sabar si
alguien puede sugerir otro planteo mejor para esta
consulta.

Atte.
Gabriel Hermes Colina Zambra

__________________________________________________
Correo Yahoo!
Espacio para todos tus mensajes, antivirus y antispam ¡gratis!
Regístrate ya - http://correo.espanol.yahoo.com/

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Gabriel Hermes Colina Zambra 2007-06-01 03:30:18 Re: datos de excel a potsgres
Previous Message WILLIAM PARRA 2007-06-01 03:03:02 Re: datos de excel a potsgres