RV: Identificar cadenas similares

From: "Daniel Ferrer" <daniel(dot)ferrer(at)ctd(dot)com(dot)ar>
To: <pgsql-es-ayuda(at)postgresql(dot)org>
Subject: RV: Identificar cadenas similares
Date: 2007-12-05 14:28:48
Message-ID: 20071205142850.6F0952E3406@postgresql.org
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda


Estimada Lista:
Apelando a sus experiencias quisiera referirme a un
problema que estamos teniendo en nuestra Aplicación.
La empresa para la cual trabajo es de logística en el
cual se registran todos los destinatarios de los envíos, la idea de
almacenarlos es de brindar a los DATA ENTRY la facilidad de encontrarlos sin
necesidad de ingresar nuevamente los datos ara así evitar errores y acelerar
el proceso de carga de datos.
El problema en cuestión se da que a través de los
distintos centros de distribución la carga de los destinatarios se ha
"ensuciado" de tal manera que ya se torna casi imposible la búsquedas de los
mismos esto debido a la duplicación de tanto de las razones sociales como
así de las direcciones.
Creo que la solución seria AGRUPAR a todos aquellos
destinos (de través de algún algoritmo) el reconocimiento de las "diferentes
cadenas similares".
Este algoritmo también lo debería aplicar en el momento
que se realiza la búsqueda en el formulario de entrada de datos.

Adjunto algunos ejemplo de repeticiones de razones sociales de destinos

BRIGHTON-BEST SOCKET SCREW SRL
BRIGHTON - BEST SOCHET SCREW SRL
BRIGHTON-BEST SOCKET SCREW S.R.L.

Adjunto algunos ejemplo de repeticiones de direcciones de destinos

KLOSERMAN 2100
KLOSTERMAN 2100
KLOSTERMAN 2100
KOSTERMAN 2100

S.O.= Linux Debían 4.0 Etch
Lenguaje= Java
DB= Postgres 8.2

A la espera de haber sido claro en la exposición del problema les agradezco
de antemano.

Atte.
___________________________
ASC Daniel Ferrer
Gerente de Sistemas - CTD SRL
Rosario - Argentina
<BLOCKED::mailto:sistemas(at)ctd(dot)com(dot)ar> mailto:sistemas(at)ctd(dot)com(dot)ar
___________________________

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message juan guzman 2007-12-05 16:06:17 Problema con log de transacciones
Previous Message Felipe Amezquita 2007-12-05 14:28:03 Re: Preocupacion con PostgreSQL