Détecter les TEXT contenant des caractères non-ASCII

From: Stephane Bortzmeyer <bortzmeyer(at)nic(dot)fr>
To: pgsql-fr-generale(at)postgresql(dot)org
Subject: Détecter les TEXT contenant des caractères non-ASCII
Date: 2009-04-06 06:57:54
Message-ID: 20090406065754.GA7261@nic.fr
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-fr-generale

Voilà, j'ai une base (encodage UTF-8) où un champ de type TEXT
contient, la plupart du temps, uniquement des caractères ASCII (code
de 0 à 128). Je voudrais récupérer les rares tuples où ce champ
contient au moins un caractère non-ASCII.

Je ne trouve pas de moyen simple de chercher ça. Il n'y a pas de
fonction toute faite et les fonctions de chaîne
<http://www.postgresql.org/docs/current/interactive/functions-string.html>
comme strpos nécessiteraient de chercher successivement chaque
caractère Unicode.

Une idée ?

convert(myfield, 'UTF8', 'ASCII') et récupérer les erreurs ?

Responses

Browse pgsql-fr-generale by date

  From Date Subject
Next Message Daniel Verite 2009-04-06 07:27:17 Re: Détecter les TEXT contenant des caractères non-ASCII
Previous Message damien@dalibo.info 2009-04-04 16:20:46 Merci !