Re: Duda acerca Tsearch con acentos

From: Rodolfo Paparás <rodo(at)globalmargin(dot)com>
To: pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: Duda acerca Tsearch con acentos
Date: 2011-08-17 20:29:49
Message-ID: 4E4C24BD.9040500@globalmargin.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

<html>
<head>
<meta content="text/html; charset=ISO-8859-1"
http-equiv="Content-Type">
</head>
<body bgcolor="#FFFFFF" text="#000000">
Hugo:<br>
<br>
Me alegro que lo hayas podido resolver. Yo creo que voy a seguir tu
camino con el m&oacute;dulo unaccent ya que tengo resultados como los que
siguen:<br>
<br>
select to_tsquery('spanish','Soci&oacute;logo');<br>
devuelve "'soci' &amp; 'log'"<br>
<br>
select to_tsquery('spanish','Sociolog&iacute;a');<br>
devuelve "'sociolog'"<br>
<br>
C&oacute;mo instalaste el m&oacute;dulo en cuesti&oacute;n y de donde lo sacaste?<br>
<br>
Saludos y gracias!<br>
<br>
El 17/08/2011 01:14 p.m., Hugo C&eacute;sar escribi&oacute;:
<blockquote
cite="mid:CAHRUeDAGV9yoaYhnWv2FBxp3WyxOsUoDx9ns-YmiX9Hbj23TQw(at)mail(dot)gmail(dot)com"
type="cite">
<div>Que tal lista...</div>
<div>&nbsp;</div>
<div>&nbsp;</div>
<div>Antes que nada gracias por los comentarios que han aportado
al tema... segui investigando</div>
<div>y haciendo pruebas y sucedio algo que me dejo
desconcertado... Ya funciona!!! les comento</div>
<div>lo que realice:</div>
<div>&nbsp;</div>
<div>- Instale el PostgreSQL 9 </div>
<div>- Monte un respaldo de una base de datos</div>
<div>- Instale el paquete unnacent</div>
<div>- Inserte el diccionario <font face="Times New Roman"
size="3"><font face="Arial" size="2">unnacent dentro de la
configuracion de busqueda (<a moz-do-not-send="true"
href="http://www.postgresql.org/docs/9.0/static/unaccent.html">http://www.postgresql.org/docs/9.0/static/unaccent.html</a>)</font>
</font></div>
<div><font face="Times New Roman" size="3">- Genere de nueva
cuenta el indice a texto completo, pero en lugar de utilizar
el diccionario spanish utilice el generado</font></div>
<div><font face="Times New Roman" size="3">&nbsp; en el punto anterior</font></div>
<div><font face="Times New Roman" size="3">- Realice una consulta
y obtuve exactamente los mismos resultados buscando la palabra
"administraci&oacute;n" y "administracion"</font></div>
<div>&nbsp;</div>
<div><font face="Times New Roman" size="3">Quiero suponer que
anteriormente instale mal el diccionario unnacent, porque
habia realizado algunas pruebas </font><font face="Times New
Roman" size="3">y me marco </font></div>
<div><font face="Times New Roman" size="3">varios errores,
entonces por eso decidi instalar todo desde 0, y es aqui donde
funciono correctamente</font></div>
<div>&nbsp;</div>
<div><font face="Times New Roman" size="3">Les comparto esto por
si alguien le sucede lo mismo.</font></div>
<div>&nbsp;</div>
<div><font face="Times New Roman" size="3">Saludos.-</font></div>
<div>&nbsp;</div>
<div><br>
&nbsp;</div>
<div>&nbsp;</div>
<div><br>
&nbsp;</div>
<div class="gmail_quote">El 16 de agosto de 2011 13:32, Alvaro
Herrera <span dir="ltr">&lt;<a moz-do-not-send="true"
href="mailto:alvherre(at)alvh(dot)no-ip(dot)org">alvherre(at)alvh(dot)no-ip(dot)org</a>&gt;</span>
escribi&oacute;:<br>
<blockquote style="margin: 0px 0px 0px 0.8ex; padding-left: 1ex;
border-left-color: rgb(204, 204, 204); border-left-width: 1px;
border-left-style: solid;" class="gmail_quote">Excerpts from
Hugo C&eacute;sar's message of lun ago 15 15:53:18 -0400 2011:<br>
<div class="im"><br>
&gt;<br>
&gt; Sin embargo, al hacer la misma prueba, pero con la
palabra "administraci&oacute;n",<br>
&gt; los resultados son<br>
&gt; diferentes, en el primer resultado me arroja la palabra
exactamente como la<br>
&gt; necesito (sin el acento),<br>
&gt; pero en el segundo resultado me trunca la palabra,
alguien sabe porque??<br>
&gt; acaso no se supone que<br>
&gt; me deberia regresar la misma palabra pero sin el acento
?? o como se supone<br>
&gt; que funciona el<br>
&gt; diccionario ??<br>
&gt;<br>
&gt; select to_tsvector('spanish','administracion');<br>
&gt; 'administracion':1<br>
&gt;<br>
&gt; select to_tsvector('spanish','administracion');<br>
&gt; 'administr':1<br>
&gt;<br>
&gt; Este detalle me esta afectando al momento de hacer las
consultas, ya que si<br>
&gt; busco esa<br>
&gt; palabra con acentos me arroja una cantidad diferente
que si la busco con el<br>
&gt; acento.<br>
<br>
</div>
Vaya, hay un problema ac&aacute; pero no es lo que t&uacute; sugieres.
&nbsp;B&aacute;sicamente,<br>
el stemmer Snowball sabe c&oacute;mo tratar con "administraci&oacute;n"
(extrae la<br>
ra&iacute;z "administr") pero no sabe c&oacute;mo tratar con
"administracion".<br>
<br>
Si pones unaccent antes de spanish_stemmer, obviamente el
stemmer nunca<br>
funcionar&aacute;. &nbsp;Pero a&uacute;n si lo pones despu&eacute;s, no va a funcionar<br>
correctamente cuando el usuario ingrese la palabra sin acento.<br>
<br>
Creo que lo que esto significa es que es necesario modificar
el stemmer<br>
de ac&aacute;<br>
<a moz-do-not-send="true"
href="http://snowball.tartarus.org/algorithms/spanish/stemmer.html"
target="_blank">http://snowball.tartarus.org/algorithms/spanish/stemmer.html</a><br>
<br>
Nota: si no quieres stemming de ning&uacute;n tipo, usa el
diccionario "simple"<br>
en vez de "spanish_stem".<br>
<font color="#888888"><br>
--<br>
&Aacute;lvaro Herrera &lt;<a moz-do-not-send="true"
href="mailto:alvherre(at)alvh(dot)no-ip(dot)org">alvherre(at)alvh(dot)no-ip(dot)org</a>&gt;<br>
</font></blockquote>
</div>
<br>
</blockquote>
<br>
</body>
</html>

Attachment Content-Type Size
unknown_filename text/html 6.2 KB

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Alvaro Herrera 2011-08-17 21:25:30 Re: Duda acerca Tsearch con acentos
Previous Message caerices 2011-08-17 18:24:08 Re: trigers y funciones