Que tal lista...
Antes que nada gracias por los comentarios que han aportado
al tema... segui investigando
y haciendo pruebas y sucedio algo que me dejo
desconcertado... Ya funciona!!! les comento
lo que realice:
- Instale el PostgreSQL 9
- Monte un respaldo de una base de datos
- Instale el paquete unnacent
- Genere de nueva
cuenta el indice a texto completo, pero en lugar de utilizar
el diccionario spanish utilice el generado
en el punto anterior
- Realice una consulta
y obtuve exactamente los mismos resultados buscando la palabra
"administración" y "administracion"
Quiero suponer que
anteriormente instale mal el diccionario unnacent, porque
habia realizado algunas pruebas y me marco
varios errores,
entonces por eso decidi instalar todo desde 0, y es aqui donde
funciono correctamente
Les comparto esto por
si alguien le sucede lo mismo.
Saludos.-
El 16 de agosto de 2011 13:32, Alvaro
Herrera
<alvherre@alvh.no-ip.org>
escribió:
Excerpts from
Hugo César's message of lun ago 15 15:53:18 -0400 2011:
>
> Sin embargo, al hacer la misma prueba, pero con la
palabra "administración",
> los resultados son
> diferentes, en el primer resultado me arroja la palabra
exactamente como la
> necesito (sin el acento),
> pero en el segundo resultado me trunca la palabra,
alguien sabe porque??
> acaso no se supone que
> me deberia regresar la misma palabra pero sin el acento
?? o como se supone
> que funciona el
> diccionario ??
>
> select to_tsvector('spanish','administracion');
> 'administracion':1
>
> select to_tsvector('spanish','administracion');
> 'administr':1
>
> Este detalle me esta afectando al momento de hacer las
consultas, ya que si
> busco esa
> palabra con acentos me arroja una cantidad diferente
que si la busco con el
> acento.
Vaya, hay un problema acá pero no es lo que tú sugieres.
Básicamente,
el stemmer Snowball sabe cómo tratar con "administración"
(extrae la
raíz "administr") pero no sabe cómo tratar con
"administracion".
Si pones unaccent antes de spanish_stemmer, obviamente el
stemmer nunca
funcionará. Pero aún si lo pones después, no va a funcionar
correctamente cuando el usuario ingrese la palabra sin acento.
Creo que lo que esto significa es que es necesario modificar
el stemmer
de acá
http://snowball.tartarus.org/algorithms/spanish/stemmer.html
Nota: si no quieres stemming de ningún tipo, usa el
diccionario "simple"
en vez de "spanish_stem".
--
Álvaro Herrera <alvherre@alvh.no-ip.org>