<html>
<head>
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
</head>
<body bgcolor="#FFFFFF" text="#000000">
Hugo:<br>
<br>
Me alegro que lo hayas podido resolver. Yo creo que voy a seguir tu
camino con el módulo unaccent ya que tengo resultados como los que
siguen:<br>
<br>
select to_tsquery('spanish','Sociólogo');<br>
devuelve "'soci' & 'log'"<br>
<br>
select to_tsquery('spanish','Sociología');<br>
devuelve "'sociolog'"<br>
<br>
Cómo instalaste el módulo en cuestión y de donde lo sacaste?<br>
<br>
Saludos y gracias!<br>
<br>
El 17/08/2011 01:14 p.m., Hugo César escribió:
<blockquote
cite="mid:CAHRUeDAGV9yoaYhnWv2FBxp3WyxOsUoDx9ns-YmiX9Hbj23TQw(at)mail(dot)gmail(dot)com"
type="cite">
<div>Que tal lista...</div>
<div> </div>
<div> </div>
<div>Antes que nada gracias por los comentarios que han aportado
al tema... segui investigando</div>
<div>y haciendo pruebas y sucedio algo que me dejo
desconcertado... Ya funciona!!! les comento</div>
<div>lo que realice:</div>
<div> </div>
<div>- Instale el PostgreSQL 9 </div>
<div>- Monte un respaldo de una base de datos</div>
<div>- Instale el paquete unnacent</div>
<div>- Inserte el diccionario <font face="Times New Roman"
size="3"><font face="Arial" size="2">unnacent dentro de la
configuracion de busqueda (<a moz-do-not-send="true"
href="http://www.postgresql.org/docs/9.0/static/unaccent.html">http://www.postgresql.org/docs/9.0/static/unaccent.html</a>)</font>
</font></div>
<div><font face="Times New Roman" size="3">- Genere de nueva
cuenta el indice a texto completo, pero en lugar de utilizar
el diccionario spanish utilice el generado</font></div>
<div><font face="Times New Roman" size="3"> en el punto anterior</font></div>
<div><font face="Times New Roman" size="3">- Realice una consulta
y obtuve exactamente los mismos resultados buscando la palabra
"administración" y "administracion"</font></div>
<div> </div>
<div><font face="Times New Roman" size="3">Quiero suponer que
anteriormente instale mal el diccionario unnacent, porque
habia realizado algunas pruebas </font><font face="Times New
Roman" size="3">y me marco </font></div>
<div><font face="Times New Roman" size="3">varios errores,
entonces por eso decidi instalar todo desde 0, y es aqui donde
funciono correctamente</font></div>
<div> </div>
<div><font face="Times New Roman" size="3">Les comparto esto por
si alguien le sucede lo mismo.</font></div>
<div> </div>
<div><font face="Times New Roman" size="3">Saludos.-</font></div>
<div> </div>
<div><br>
</div>
<div> </div>
<div><br>
</div>
<div class="gmail_quote">El 16 de agosto de 2011 13:32, Alvaro
Herrera <span dir="ltr"><<a moz-do-not-send="true"
href="mailto:alvherre(at)alvh(dot)no-ip(dot)org">alvherre(at)alvh(dot)no-ip(dot)org</a>></span>
escribió:<br>
<blockquote style="margin: 0px 0px 0px 0.8ex; padding-left: 1ex;
border-left-color: rgb(204, 204, 204); border-left-width: 1px;
border-left-style: solid;" class="gmail_quote">Excerpts from
Hugo César's message of lun ago 15 15:53:18 -0400 2011:<br>
<div class="im"><br>
><br>
> Sin embargo, al hacer la misma prueba, pero con la
palabra "administración",<br>
> los resultados son<br>
> diferentes, en el primer resultado me arroja la palabra
exactamente como la<br>
> necesito (sin el acento),<br>
> pero en el segundo resultado me trunca la palabra,
alguien sabe porque??<br>
> acaso no se supone que<br>
> me deberia regresar la misma palabra pero sin el acento
?? o como se supone<br>
> que funciona el<br>
> diccionario ??<br>
><br>
> select to_tsvector('spanish','administracion');<br>
> 'administracion':1<br>
><br>
> select to_tsvector('spanish','administracion');<br>
> 'administr':1<br>
><br>
> Este detalle me esta afectando al momento de hacer las
consultas, ya que si<br>
> busco esa<br>
> palabra con acentos me arroja una cantidad diferente
que si la busco con el<br>
> acento.<br>
<br>
</div>
Vaya, hay un problema acá pero no es lo que tú sugieres.
Básicamente,<br>
el stemmer Snowball sabe cómo tratar con "administración"
(extrae la<br>
raíz "administr") pero no sabe cómo tratar con
"administracion".<br>
<br>
Si pones unaccent antes de spanish_stemmer, obviamente el
stemmer nunca<br>
funcionará. Pero aún si lo pones después, no va a funcionar<br>
correctamente cuando el usuario ingrese la palabra sin acento.<br>
<br>
Creo que lo que esto significa es que es necesario modificar
el stemmer<br>
de acá<br>
<a moz-do-not-send="true"
href="http://snowball.tartarus.org/algorithms/spanish/stemmer.html"
target="_blank">http://snowball.tartarus.org/algorithms/spanish/stemmer.html</a><br>
<br>
Nota: si no quieres stemming de ningún tipo, usa el
diccionario "simple"<br>
en vez de "spanish_stem".<br>
<font color="#888888"><br>
--<br>
Álvaro Herrera <<a moz-do-not-send="true"
href="mailto:alvherre(at)alvh(dot)no-ip(dot)org">alvherre(at)alvh(dot)no-ip(dot)org</a>><br>
</font></blockquote>
</div>
<br>
</blockquote>
<br>
</body>
</html>