Re: Duda acerca Tsearch con acentos

From: Hugo César <hugocesar49(at)gmail(dot)com>
To: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: Duda acerca Tsearch con acentos
Date: 2011-08-17 16:14:13
Message-ID: CAHRUeDAGV9yoaYhnWv2FBxp3WyxOsUoDx9ns-YmiX9Hbj23TQw@mail.gmail.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

Que tal lista...

Antes que nada gracias por los comentarios que han aportado al tema... segui
investigando
y haciendo pruebas y sucedio algo que me dejo desconcertado... Ya
funciona!!! les comento
lo que realice:

- Instale el PostgreSQL 9
- Monte un respaldo de una base de datos
- Instale el paquete unnacent
- Inserte el diccionario unnacent dentro de la configuracion de busqueda (
http://www.postgresql.org/docs/9.0/static/unaccent.html)
- Genere de nueva cuenta el indice a texto completo, pero en lugar de
utilizar el diccionario spanish utilice el generado
en el punto anterior
- Realice una consulta y obtuve exactamente los mismos resultados buscando
la palabra "administración" y "administracion"

Quiero suponer que anteriormente instale mal el diccionario unnacent, porque
habia realizado algunas pruebas y me marco
varios errores, entonces por eso decidi instalar todo desde 0, y es aqui
donde funciono correctamente

Les comparto esto por si alguien le sucede lo mismo.

Saludos.-

El 16 de agosto de 2011 13:32, Alvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>escribió:

> Excerpts from Hugo César's message of lun ago 15 15:53:18 -0400 2011:
>
> >
> > Sin embargo, al hacer la misma prueba, pero con la palabra
> "administración",
> > los resultados son
> > diferentes, en el primer resultado me arroja la palabra exactamente como
> la
> > necesito (sin el acento),
> > pero en el segundo resultado me trunca la palabra, alguien sabe porque??
> > acaso no se supone que
> > me deberia regresar la misma palabra pero sin el acento ?? o como se
> supone
> > que funciona el
> > diccionario ??
> >
> > select to_tsvector('spanish','administracion');
> > 'administracion':1
> >
> > select to_tsvector('spanish','administracion');
> > 'administr':1
> >
> > Este detalle me esta afectando al momento de hacer las consultas, ya que
> si
> > busco esa
> > palabra con acentos me arroja una cantidad diferente que si la busco con
> el
> > acento.
>
> Vaya, hay un problema acá pero no es lo que tú sugieres. Básicamente,
> el stemmer Snowball sabe cómo tratar con "administración" (extrae la
> raíz "administr") pero no sabe cómo tratar con "administracion".
>
> Si pones unaccent antes de spanish_stemmer, obviamente el stemmer nunca
> funcionará. Pero aún si lo pones después, no va a funcionar
> correctamente cuando el usuario ingrese la palabra sin acento.
>
> Creo que lo que esto significa es que es necesario modificar el stemmer
> de acá
> http://snowball.tartarus.org/algorithms/spanish/stemmer.html
>
> Nota: si no quieres stemming de ningún tipo, usa el diccionario "simple"
> en vez de "spanish_stem".
>
> --
> Álvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>
>

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Pedro Castro 2011-08-17 16:21:33 trigers y funciones
Previous Message Alvaro Herrera 2011-08-16 18:32:33 Re: Duda acerca Tsearch con acentos