El 16 de agosto de 2011 13:32, Alvaro Herrera <alvherre@alvh.no-ip.org> escribió:

Excerpts from Hugo César's message of lun ago 15 15:53:18 -0400 2011:

>
> Sin embargo, al hacer la misma prueba, pero con la palabra "administración",
> los resultados son
> diferentes, en el primer resultado me arroja la palabra exactamente como la
> necesito (sin el acento),
> pero en el segundo resultado me trunca la palabra, alguien sabe porque??
> acaso no se supone que
> me deberia regresar la misma palabra pero sin el acento ?? o como se supone
> que funciona el
> diccionario ??
>
> select to_tsvector('spanish','administracion');
> 'administracion':1
>
> select to_tsvector('spanish','administracion');
> 'administr':1
>
> Este detalle me esta afectando al momento de hacer las consultas, ya que si
> busco esa
> palabra con acentos me arroja una cantidad diferente que si la busco con el
> acento.

Vaya, hay un problema acá pero no es lo que tú sugieres. Básicamente,
el stemmer Snowball sabe cómo tratar con "administración" (extrae la
raíz "administr") pero no sabe cómo tratar con "administracion".

Si pones unaccent antes de spanish_stemmer, obviamente el stemmer nunca
funcionará. Pero aún si lo pones después, no va a funcionar
correctamente cuando el usuario ingrese la palabra sin acento.

Creo que lo que esto significa es que es necesario modificar el stemmer
de acá
http://snowball.tartarus.org/algorithms/spanish/stemmer.html

Nota: si no quieres stemming de ningún tipo, usa el diccionario "simple"
en vez de "spanish_stem".

--
Álvaro Herrera <alvherre@alvh.no-ip.org>