Re: Ordenació

From: Alvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org>
To: Manuel Sugawara <masm(at)fciencias(dot)unam(dot)mx>
Cc: David Prieto <davidp(at)sgth(dot)es>, 'Xavier Vidal' <xvpxvp(at)menta(dot)net>, pgsql-es-ayuda(at)postgresql(dot)org
Subject: Re: Ordenació
Date: 2005-09-29 16:36:54
Message-ID: 20050929163654.GJ5272@surnet.cl
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-es-ayuda

On Thu, Sep 29, 2005 at 11:15:47AM -0500, Manuel Sugawara wrote:
> Alvaro Herrera <alvherre(at)alvh(dot)no-ip(dot)org> writes:
>
> > Tiene que si insertas datos con una codificacion erronea, despues al
> > tratar de ordenarlo va a interpretar los bytes de manera equivocada.
>
> ¿Pero qué eso no se notaría al mostrar basura en donde debería haber
> acentos?. Creo que más bien el error esta aqui:
>
> > Efectivamente, mi base de datos se creó con LATIN1. El terminal desde el
> > que hice un "psql" para hacer los inserts tiene:
> >
> > LANG=es_ES.UTF-8
> >
> > Y pg_controldata devuelve:
> >
> > LC_COLLATE: es_ES.UTF-8
> > LC_CTYPE: es_ES.UTF-8

Ah, supongo que me salté esta parte o me hice el ciego ;-) Sí, esto
está mal declarado.

> Nótese el LC_COLLATE: es_ES.UTF-8. Es decir, tu teoría es correcta
> pero no creo que sea problema en la comunicación de la información
> sino en haber puesto el collate en UTF-8. Un experimiento confirma la
> teoría (nótese que aqui es al revés, ie, mis datos están en UTF-8):

Confirmo que haciendo este experimento acá, con mis datos en Latin1,
hay un error entre la ó y la o. Pero observa que es diferente donde
pone García en tu caso y en el mío, con la codificacion incorrecta:

$ cat nombres | LANG=es_CL.utf8 sort
García
Gómez
Gómez Alonso
Gómez Alvarez
Gómez Pérez
Gomez
González
Guadix

> masm(at)conexa$ cat ~/nombres | LANG=es_MX.ISO-8859-1 sort
> Gómez
> Gómez Alonso
> Gómez Alvarez
> Gómez Pérez
> García
> Gomez
> González
> Guadix
> masm(at)conexa$ echo $LANG

> En fin, suena a que el cuate tiene que re-initdb con los parámetros
> adecuados (ie, es_ES.ISO-8859-1).

Así parece.

Espero que al amigo Xavier le haya servido de algo toda esta discusión ...
(Una conclusión inmediata que se puede obtener es que es muy fácil tener
una configuración errónea, porque hay muchos parámetros en los que
equivocarse)

--
Alvaro Herrera http://www.amazon.com/gp/registry/DXLWNGRJD34
Jason Tesser: You might not have understood me or I am not understanding you.
Paul Thomas: It feels like we're 2 people divided by a common language...

In response to

Responses

Browse pgsql-es-ayuda by date

  From Date Subject
Next Message Karla Paola Diazgranados Sánchez 2005-09-29 17:03:53 Consultas bivariadas
Previous Message Alvaro Herrera 2005-09-29 16:16:41 Re: consulta de sql para postgresql