From: | Volkan YAZICI <yazicivo(at)ttnet(dot)net(dot)tr> |
---|---|
To: | Emre Sevinc <emres(at)bilgi(dot)edu(dot)tr> |
Cc: | "Ahmet A(dot) Akin" <ahmetaa(at)gmail(dot)com>, dev(at)zemberek(dot)dev(dot)java(dot)net, pgsql-tr-genel(at)postgresql(dot)org |
Subject: | Re: SimMetrics: string benz |
Date: | 2006-08-22 05:45:55 |
Message-ID: | 20060822054555.GB1406@alamut |
Views: | Whole Thread | Raw Message | Download mbox | Resend email |
Thread: | |
Lists: | pgsql-tr-genel |
On Aug 22 12:49, Emre Sevinc wrote:
> - PostgreSQL gibi kritik ve büyük, uluslararasi capta, Türkiye'de de
> cesitli ciddi isler icin kullanilan ve Türklerin de katkida bulundugu
> bir sistemin Ingilizce, Almanca gibi diller icin birtakim
> dogal dil isleri icin sundugu imkanlar varken Türkce icin ayni bakimdan
> sundugu imkan sifir.
Evet. PostgreSQL ile gelen bir helva fabrikası mevcut. Yalnız hammaddeyi
bizim sağlamamızı istiyorlar.
> - En basitinden Türkce kökbulucu ("stemmer" karsiligi olarak kullandim)
> bile PosgreSQL ve Türkce arakesitindeki bir boslugu doldurmaya baslar
> kayda deger gelisme olur. Bunu Zemberek paralelinde daha büyük capli
> gelismeler izleyebilir.
PostgreSQL'in şu an UTF-8 yereli kullanırken upper/lower
fonksiyonlarının sorunlu olması dışında hiçbir Türkçe sorunu yok. (Bu
problemin sebebi de PostgreSQL'in aynı anda onlarca farklı mimari ve
platformu desteklemek adına kasmasından kaynaklı.) Ve bunu aşmanın da
yolları var: İster bunun için benim yazmadığım yamayı kullanırsınız,
isterseniz ICU kütüphanesi yamasını kullanırsınız.
> - En azindan bir PostgreSQL hacker'i (Volkan) kisa sürede test edilmis
> Java kodunu PostgreSQL'e entegre edebilecegini belirtti.
(PostgreSQL hacker'ı olmak için bir kaç ulusun 1 haftada tükettiği
ekmeği yemem lazım daha. Ben sadece ufak tefek TODO'ları ancak
yapabiliyorum.) Evet, TurkishStemmer() metodu export edilmiş bir JAR
kütüphanesini, tsearch2 tarafından kullanılabilir hale getirebileceğimi
düşünüyorum. (Ama bu konu hakkında bir önceki e-postamda yazdığım
Snowball kütüphaneleri hakkındaki paragrafı okumanızı öneririm.)
İyi çalışmalar.
From | Date | Subject | |
---|---|---|---|
Next Message | Volkan YAZICI | 2006-08-22 05:52:19 | Re: SimMetrics: string benz |
Previous Message | Volkan YAZICI | 2006-08-22 05:34:37 | Re: SimMetrics: string benz |