Re: to_tsvector: errori nella configurazione italiana

From: rotellaro(at)gmail(dot)com
To: pgsql-it-generale(at)postgresql(dot)org
Subject: Re: to_tsvector: errori nella configurazione italiana
Date: 2008-06-13 06:58:25
Message-ID: a3e8e2210806122358m21b301eu25e96583a66773f0@mail.gmail.com
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-it-generale

2008/6/13 Giorgio Valoti <giorgio_v(at)mac(dot)com>:
Ciao Giorgio,

>>> test=> select to_tsvector('italian','prova');
>>> ERROR: invalid byte sequence for encoding "UTF8": 0xc3
>>> HINT: This error can also happen if the byte sequence does not match the
>>> encoding expected by the server, which is controlled by "client_encoding".
>>>
>>
>> whereas using english works fine:
>>
>>
>>> test=> select to_tsvector('english','prova');
>>> to_tsvector
>>> -------------
>>> 'prova':1
>>> (1 row)
>>>
>>
>> Danish's fine too, but not french (same error). All the .stop files
>> (italian, french, and danish) are utf8-encoded but maybe it doesn't matter,
>> I just don't know.
>>
>> I'm using the 8.3 version with Mac OS X 10.5.3 (pg server) and Mac OS X
>> 10.4.11 (psql client).
>
>

Senza saper ne leggere e ne scrivere questo errore mi puzza di import
da sql_ascii lontano un kilometro.

Il database su cui stai operando suppongo sia UTF8.
Sarebbe interessante capire come sono caricati questi dati e
l'encoding dell'eventuale database di origine.

Ad ogni modo prova la seguente procedura.
Esporta il database di origine con pg_dump passandogli l'opzione
--encoding=UTF8.
Converti il dump in utf8 con iconv
http://www.gnu.org/software/libiconv/documentation/libiconv/iconv.1.html
e caricalo in un altro database creato esplicitamente in UTF8.

Se la situazione e' come immagino ti sparira' l'errore ma ti
appariranno caratteri strani, sintomo di pastrocchi a livello
encoding.

Ciao
Fede

--
(all opinions expressed are my own)
Federico Campoli
PostgreSQL Consulting -> PGHost http://www.pghost.eu

In response to

Responses

Browse pgsql-it-generale by date

  From Date Subject
Next Message rotellaro 2008-06-13 07:03:00 Re: to_tsvector: errori nella configurazione italiana
Previous Message Giorgio Valoti 2008-06-13 06:42:10 to_tsvector: errori nella configurazione italiana