Quick Links

Détecter les TEXT contenant des caractères non-ASCII

From:	Stephane Bortzmeyer <bortzmeyer(at)nic(dot)fr>
To:	pgsql-fr-generale(at)postgresql(dot)org
Subject:	Détecter les TEXT contenant des caractères non-ASCII
Date:	2009-04-06 06:57:54
Message-ID:	20090406065754.GA7261@nic.fr
Views:	Whole Thread \| Raw Message \| Download mbox \| Resend email
Thread:
Lists:	pgsql-fr-generale

Voilà, j'ai une base (encodage UTF-8) où un champ de type TEXT
contient, la plupart du temps, uniquement des caractères ASCII (code
de 0 à 128). Je voudrais récupérer les rares tuples où ce champ
contient au moins un caractère non-ASCII.

Je ne trouve pas de moyen simple de chercher ça. Il n'y a pas de
fonction toute faite et les fonctions de chaîne
<http://www.postgresql.org/docs/current/interactive/functions-string.html>
comme strpos nécessiteraient de chercher successivement chaque
caractère Unicode.

Une idée ?

convert(myfield, 'UTF8', 'ASCII') et récupérer les erreurs ?

Responses

Re: Détecter les TEXT contenant des caractères non-ASCII at 2009-04-06 07:27:17 from Daniel Verite

Browse pgsql-fr-generale by date

	From	Date	Subject
Next Message	Daniel Verite	2009-04-06 07:27:17	Re: Détecter les TEXT contenant des caractères non-ASCII
Previous Message	damien@dalibo.info	2009-04-04 16:20:46	Merci !