Re: UNICODE veri tabanı

From: Volkan YAZICI <yazicivo(at)ttnet(dot)net(dot)tr>
To: Nilgün Belma Bugüner <nilgun(at)belgeler(dot)gen(dot)tr>
Cc: pgsql-tr-genel(at)postgresql(dot)org
Subject: Re: UNICODE veri tabanı
Date: 2006-09-05 07:58:41
Message-ID: 20060905075840.GC1369@alamut
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-tr-genel

On Sep 05 10:43, Nilgün Belma Bugüner wrote:
> Sal 05 Eyl 2006 10:25 sularında, Volkan YAZICI şunları yazmıştı:
> > On Aug 31 12:29, Nilgün Belma Bugüner wrote:
> > > UNICODE ile UTF-8 aynı kodlamanın farklı isimleri sadece,
> >
> > Hem evet, hem hayır. PostgreSQL bir kaç sürüm öncesine kadar UNICODE ve
> > UTF-8'i aynı kefeye koyuyordu. Fakat sorun şu ki, UTF-16 ile UTF-32 de
> > UNICODE. Bu sebepten ötürü (yanlış hatırlamıyorsam) artık yeni
> > sürümlerde UNICODE diye bir seçenek yok, onun yerine sadece UTF-8
> > mevcut.

Yukarıdaki sözler hafif işkembeden gibi duruyor. İlgili bağlantıyı
vereyim: http://archives.postgresql.org/pgsql-odbc/2006-03/msg00226.php

> UTF-8, "glibc bağlamında" UTF-16 ile UTF-32'yi kapsıyor.
> Yine "glibc bağlamında" Unicode ile UTF-8 eşanlamlıdır.
>
> Bence böyle de olması gerekir, çünkü bir sistemde aynı
> anda bir kaç dilin birden desteklenmesinin istendiği bir
> noktada tekrar 256 karakterlik karakter kodlamasındaki
> günlere dönecek olsaydık (bu sefer kapsam daha geniş olsa da
> tamamı olmayacağından) Unicode kendini gereksiz hale
> getirmiş olacaktı. Onun için bunların hepsi tek olmak
> zorunda.

Bu konuda sizin ile hemfikir değilim. Veritabanında UTF-8, UTF-16 ve
UTF-32 olduğunca birbirinden ayrı tutulmak zorunda. Çünkü bunların disk
üzerinde gösterimleri birbirlerinden farklı boyutlarda. Ve veritabanında
disk I/O'sunun en önemli sorun teşkil ettiğini göz önüne alacak olursak,
büyükçe bir tablodaki metin alanlarının UTF-8 ile UTF-32 kullanılarak
saklanması/işlenmesi arasında kayda değer bir performans farkı olacağı
aşikardır. Kaldı ki, eğer böyle bir fark önemsenmeyecek kadar az
olsaydı, PostgreSQL yıllar öncesinden UTF-32'ye geçip büyük bir sorunu
sırtından atmış olurdu.

İyi çalışmalar.

In response to

Responses

Browse pgsql-tr-genel by date

  From Date Subject
Next Message Volkan YAZICI 2006-09-05 08:19:42 Re: BUG #1931: ILIKE and LIKE fails on Turkish locale
Previous Message Devrim GUNDUZ 2006-09-05 07:56:07 Türkçe'de ILIKE-LIKE sorununun çözümü