Re: UNICODE veri tabanı

From: Nilgün Belma Bugüner <nilgun(at)belgeler(dot)gen(dot)tr>
To: pgsql-tr-genel(at)postgresql(dot)org
Subject: Re: UNICODE veri tabanı
Date: 2006-09-05 08:39:01
Message-ID: 200609051139.02155.nilgun@belgeler.gen.tr
Views: Raw Message | Whole Thread | Download mbox | Resend email
Thread:
Lists: pgsql-tr-genel

Sal 05 Eyl 2006 10:58 sularında, Volkan YAZICI şunları yazmıştı:
> On Sep 05 10:43, Nilgün Belma Bugüner wrote:
> > Sal 05 Eyl 2006 10:25 sularında, Volkan YAZICI şunları yazmıştı:
> > > On Aug 31 12:29, Nilgün Belma Bugüner wrote:
> > > > UNICODE ile UTF-8 aynı kodlamanın farklı isimleri sadece,
> > >
> > > Hem evet, hem hayır. PostgreSQL bir kaç sürüm öncesine kadar UNICODE ve
> > > UTF-8'i aynı kefeye koyuyordu. Fakat sorun şu ki, UTF-16 ile UTF-32 de
> > > UNICODE. Bu sebepten ötürü (yanlış hatırlamıyorsam) artık yeni
> > > sürümlerde UNICODE diye bir seçenek yok, onun yerine sadece UTF-8
> > > mevcut.
>
> Yukarıdaki sözler hafif işkembeden gibi duruyor. İlgili bağlantıyı
> vereyim: http://archives.postgresql.org/pgsql-odbc/2006-03/msg00226.php
>
> > UTF-8, "glibc bağlamında" UTF-16 ile UTF-32'yi kapsıyor.
> > Yine "glibc bağlamında" Unicode ile UTF-8 eşanlamlıdır.
> >
> > Bence böyle de olması gerekir, çünkü bir sistemde aynı
> > anda bir kaç dilin birden desteklenmesinin istendiği bir
> > noktada tekrar 256 karakterlik karakter kodlamasındaki
> > günlere dönecek olsaydık (bu sefer kapsam daha geniş olsa da
> > tamamı olmayacağından) Unicode kendini gereksiz hale
> > getirmiş olacaktı. Onun için bunların hepsi tek olmak
> > zorunda.
>
> Bu konuda sizin ile hemfikir değilim. Veritabanında UTF-8, UTF-16 ve
> UTF-32 olduğunca birbirinden ayrı tutulmak zorunda. Çünkü bunların disk
> üzerinde gösterimleri birbirlerinden farklı boyutlarda. Ve veritabanında
> disk I/O'sunun en önemli sorun teşkil ettiğini göz önüne alacak olursak,
> büyükçe bir tablodaki metin alanlarının UTF-8 ile UTF-32 kullanılarak
> saklanması/işlenmesi arasında kayda değer bir performans farkı olacağı
> aşikardır. Kaldı ki, eğer böyle bir fark önemsenmeyecek kadar az
> olsaydı, PostgreSQL yıllar öncesinden UTF-32'ye geçip büyük bir sorunu
> sırtından atmış olurdu.
>

Tek bildiğim, 32 bite kadar bütün geniş veya çokbaytlı karakterleri
glibc'nin UTF-8 bağlamında işlemi soktuğudur.

Bunu benimle boşuna tartışmayın. Ben C kütüphanesi gerçeklenimcisi
değilim sonuçta. Glibc kılavuzunda bu konuda bilgi var. Ben glibc'nin
yaklaşımına dayanarak acizane fikrimi belirttim. Başka sistemler bunu
nasıl ele alıyor bilmiyorum. Bilmek de ayrıca benim açımdan önemli değil.
Aklın yolu birdir. Onlar da bir gün doğru yolu bulurlar.

Esen kalın,
Nilgün

In response to

Browse pgsql-tr-genel by date

  From Date Subject
Next Message Victor Snezhko 2006-09-05 09:26:22 Re: BUG #1931: ILIKE and LIKE fails on Turkish locale
Previous Message Volkan YAZICI 2006-09-05 08:23:56 Re: Türkçe'de ILIKE-LIK