top of page
  • ederincan

Osmanlı Türkçesi ve Yapay Zekâ Uygulamaları: osmanlica.com Örneği

Osmanlı Türkçesi arşivlerin büyüklüğü (arşiv belgeleri, el yazmaları, kitaplar, süreli yayınlar) bu yazı dilinin okunmasını, erişimini, belgelerin Optik Karakter Tanıma (OCR) ile taranabilir hale getirilmesini ya da Latin harflerine aktarılmasını önemli bir hale getirmektedir. Diğer yandan Osmanlı Türkçesi metinlerin ulaşılabilirliği ve anlaşılabilirliği meselesi Türk edebiyatı ve tarihinin yanı sıra diğer pek çok disiplindeki araştırmacının farklı tema ve yöntemlerle ilgi alanına girmektedir.



Disiplinler arası çalışmaların artışı ve Dijital Beşerî Bilimlerin hız kazanması ile Osmanlı Türkçesi metinlerin bilgisayarlar tarafından işlenebilir hale getirilmesi için yöntem ve araçlar da artmıştır. Örneğin en yaygın olarak hayatımızda olan Optik Karakter Tanıma (OCR) yöntemi Osmanlıca metinleri sayısallaştırmaktadır. Gelişmiş işlem ve analiz teknikleri bir tarafa sadece devasa boyutlardaki Osmanlıca arşivlerin, kelime bazlı arama yapılabilir hale getirilmesi dahi Osmanlıca külliyatla çalışan araştırmacıların işini zaman ve incelenecek belge hacmi açısından önemli ölçüde kolaylaştıracak ve hızlandıracaktır. Muteferriqa ya da Wikilala gibi ticari oluşumlar özellikle Osmanlıca matbu metinler için OCR teknolojisi ile bu alanda önemli bir hizmet sunmaktadır. Dijital kütüphane olarak isimlendirebileceğimiz bu uygulamalar matbu Osmanlıca külliyatlar içerisinde kelime bazlı arama yapılmasına olanak tanımakla birlikte veritabanlarını da sürekli olarak genişletmektedirler.


OCR ve yapay zekadan yararlanarak Osmanlıca metinleri okunabilir/taranabilir/işlenebilir hale getirmeyi vadeden ticari uygulamalar kervanına yakın zamanda osmanlica.com katıldı. İstanbul Üniversitesi Mühendislik Fakültesi’nden Doç. Dr. Atakan Kurt ve doktora öğrencisi İshak Dölek tarafından geliştirilen uygulama Osmanlı Türkçesi belgeleri OCR'ın ötesinde Latin harflerine dönüştürerek transkripsiyonunu ve Modern Türkçe’ye çevirisini de vadediyor. Uygulama aynı zamanda TÜBİTAK destekli Osmanlıcadan Günümüz Türkçesine Yapay Zekâ Destekli Uçtan Uca Aktarım projesinin çıktılarının kullanıcıların hizmetine sunulmuş versiyonudur. Ancak uygulamanın nihai hedefine henüz ulaşmadığını ve çalışmaların devam ettiğini not etmek gerekmektedir.


Osmanlica.com kendi dijital kütüphanelerini oluşturan ve o kütüphanede kelime araması imkanı sağlayan diğer uygulamalara ilave olarak kullanıcıların kendi belgelerini yükleyerek OCR ve Latinize etmeyi sağlayacak bir altyapı geliştirmiştir.


Uygulamanın kullanımı için bazı aşamalar bulunmaktadır. İlk ve temel aşama Osmanlıca metin içeren görüntü dosyalarının OCR ile metin dosyasına çevrilmesidir. Görüntü dosyası websitesi üzerinden sisteme yüklendiğinde araştırmacılar düzenlenebilir bir metin çıktısına sahip olabilmektedir. Arap harfleriyle hazırlanan metinlerin çıktılarını düzenlemek için sitede bir sanal klavye de mevcut. Bir sonraki adım ise bu Arap harfli metni Latinize etmek yani transkripsiyon işlemidir. Araştırmacılar orjinal metin ile yan yana görüntüleme seçeneği sayesinde Latin harflerine aktarılmış metinleri rahatlıkla düzenleyebiliyor. Uygulamanın özgün bir yanı olarak sistem alternatif çevirileri görme ve seçme imkânı veriyor. Her ne kadar henüz kullanıcıların hizmetine açılmamış olsa da Dil Çevirisi seçeneği metni günümüz Türkçesine çevirmeyi vadediyor. Uygulama tüm bu aşamaları başarıyla tamamladığında matbu Osmanlı Türkçesi metinleri Osmanlıca uzmanlığı olmayan araştırmacıların da kullanımına sunmuş olacak.




Matbu Osmanlıca metinler için sayısallaştırma hizmetleri hızla artarken bu girişimlerin araştırmacılar için ne kadar kullanılabilir olduğunun tartışılması da önemli bir ihtiyaçtır. Özellikle ciddi bir emekle hazırlanan bu uygulamaların ve veritabanlarının başarı ve doğruluk oranları şeffaf şekilde araştırmacılarla paylaşılmalıdır. Örneğin bu veritabanlarında kelime taramalarının başarı oranı nedir? sonuç listesi tüm külliyat içerisinde hangi orana denk gelmektedir? gibi soruların cevapları bu araçlar kullanılarak yapılacak akademik çalışmaların niteliği için hayati öneme sahiptir. Bu nedenle bu girişimlerin altyapı ve teknik yönlerinin yanı sıra sınırları ve kapsamlarının daha net ifade edilerek beşerî bilimcilerin kullanımına sunulması uygun olacaktır.


留言


bottom of page