top of page
  • emirhankabataş

Voyant Tools ile Metin Analizi: Kısa Rehber

Blog Yazısı: Emirhan Kabataş




Dijital Beşeri Bilimlerde metin analizi çalışmalarında sıkça başvurulan web tabanlı bir araç olan Voyant Tools TXT, HTML, XML, PDF, RTF ve MS Word dahil olmak üzere çeşitli formatlarda metin veya metin koleksiyonunuzla çalışmanızı kolaylaştırmak için tasarlanmıştır. Bu kısa rehberde herhangi bir kodlama becerisi gerektirmeden herkesin kolaylıkla kullanabileceği Voyant Tools’un temel özelliklerini Julia Pardoe’nin The City of the Sultan; and Domestic Manners of the Turks (cilt 1) adlı eseri örneği üzerinden uygulamalı olarak tanıtacağız. Bu eser, 1836 yılında babasının askerî görevi nedeniyle İstanbul’a gelen Pardoe’nun şehirdeki anılarını içermektedir.


Öncelikle Voyant Tools, Stefan Sinclair ve Geoffrey Rockwell tarafından geliştirilen ücretsiz bir araç platformudur. Bu nedenle araçlara websitesi üzerinden erişerek kullanmaya başlayabilirsiniz. Voyant Tools’u kullanmaya başlarken basit arayüzlü bir ekran bizi karşılıyor.


Ek 1


Görülebileceği gibi metin ekleme kısmına metni kopyalayabilir, URL kaynağını ekleyebilir, sol alttaki sekmelerden kendi kaynağınızı sisteme yükleyebilir ya da sistemde var olan bir kaynağı açabilirsiniz. Sistemde Nisan 2023 itibariyle Shakespeare’in oyunları, Austen’in romanları ve Shelley’in Frankestein’ı hazır bulunmaktadır.


Sağ üstteki tuşlardan ilkiyle dil ile ilgili ayarlamalar yapabilirsiniz. Voyant Tools’un şu anda 12 dil desteği verdiğini, ayrıca otomatik dil seçimi seçeneğinin de bulunduğunu söyleyebiliriz. Fakat genellikle kaynak dil İngilizce dışına çıktığında, özellikle de Türkçe gibi destekli dil listesinde de bulunmayan bir dil kullanıldığında analizlerin tam olarak sağlıklı çalışmaması oldukça olası. Çünkü bu araçlar, mümkün olduğunca metni anlayabilmeliler ve bu da, nispeten desteklenen dillerde daha mümkün olabiliyor. Öte yandan sağ üstteki diğer bir sekme ile metnin biçimsel içeriğine dair (XML, HTML, JSON vs.) ayarlamalar yapılabilir. Fakat kullandığınız metin dijitize edilmiş bir kitap ise ilk aşamada bu detaylarla ilgilenmenize gerek yok.


Rehberde kullanacağımız metin, daha önce de ifade ettiğimiz gibi Julia Pardoe’nun anıları. O hâlde kaynağı upload sekmesinden sisteme yükleyerek işe başlıyoruz. Kaynak sisteme yüklendiğinde sizi analiz ve görselleştirmelerin bulunduğu bir ekran karşılayacak. Bu ekran başlangıçta biraz karmaşık gelebilir. Şimdi Voyant Tools’un analiz ve görselleştirmelerinin bulunduğu bu ekranı yakından incelemeye başlayabiliriz.



Ek 2


Aşağıda detaylı olarak görülebileceği gibi sol üstte bulunan Cirrus kısmı, metinde sık geçen kelimelerden oluşan bir bulut görselleştirmesi içerir. Terms kaydırma çubuğu ölçeğini büyütüp küçülterek daha detaylı ya da detayları azaltılmış bir kelime bulutuna sahip olabilirsiniz. Ayrıca imleçle bulutta bulunan kelimelerin üstüne gelerek ve tıklayarak kelimelerin ne sıklıkta kullanıldığını görebilirsiniz (Ek.3). Bu kelime bulutu görselleştirmesinde yer alan kelimelerin büyük ve küçük boyutta gözükmesinin sebebi, metinde daha sık veya daha nadir kullanılmalarıdır. Öte yandan Terms sekmesine tıkladığıdınızda da bulutta yer alan kelimelerin metinde kaç defa geçtiğini gösteren bir tablo görebilirsiniz (Ek.4). Son olarak Links kısmında da anahtar (sık geçen) kelimeler merkezinde kelime bağlantılarına dair ağ görselleştirmeleri yer almakta (Ek.5). Burada hangi temel kelimelerin hangi kelimelerle sıklıkla birlikte kullanıldığı, kombinasyonlandığı ve anahtar kelime bağlantılarıyla diğer hangi kelimelerle bir bağlantıya sahip olabileceğini görüntüleyebilirsiniz. Burada oldukça önemli bir husus ise eserdeki kelimeleri incelemek adına yapılacak metin analizlerinde gereksiz bağlaç veya eklerin analizden çıkarılmasını sağlayan Stopwords özelliğidir. Bu liste, bir analizin sonuçlarından çıkarılması gereken bir dizi kelimedir ve genellikle belirteçler ve edatlar (de, da, ama, birçok vb.) gibi fazla anlam taşımayan işlev sözcüklerini içerir (Ek 6).




Ek 3

Ek 4

Ek 5



Ek 6


Ekranın ilk kısmını inceledikten sonra orta üst kısımda yer alan ve Reader ile TermsBerry araçlarının yer aldığı alana bakıyoruz. Bu kısımda temel olarak iki araç mevcut, bunlardan ilki olan Reader yani okuyucu bölümünde yer alan araç ile yüklediğiniz metni daha detaylı görüntülemek mümkün (Ek.7). Bu okuyucuda imleç ile kelime üzerine gelindiğinde metinde kelimenin kaç defa geçtiğini gösteren bir sekme çıkıyor. TermsBerry kısmında ise daha farklı bir görselleştirme mecvut. Tıpkı Links kısmında olduğu gibi bir ağ analizi görselleştirmesi içeren TermsBerry’de, bir salkım şeklinde bir grup kelime yer alıyor (Ek.8). İmleç ile herhangi bir kelimenin üstüne gelindiğinde de o kelimenin ilgili ve bağlantılı olduğu diğer kelimeler, mezkur kelime ile aynı renge bürünüyor. Böylece ilgili ve bağlantılı kelimeleri gösteren bir görselleştirme oluşuyor.



Ek 7

Ek 8


Ekranın sağ kısmında yer alan araç kutusunda ise Trends ve Document Terms kısımları bulunuyor. Trends aracında eğer tek bir kaynak ile çalışıyorsak, belirgin kelimelerin eser boyunca hangi kısımlarda ne sıklıkta kullanıldığını gösteren bir grafik oluşturulur (Ek.9). Bu grafiğin güzel bir yanı ekranda çıkan otomatik kelimelerin yanı sıra sizin ilgilendiğiniz özel kavramları da grafiğe ekleyip çıkarma özelliği sunması. Böylece bu kavramların eser içindeki trend grafiğini görselleştirebilirsiniz. Bu trend grafiği eğer birkaç kaynak birlikte inceleniyorsa diğer kaynaklarla karşılaştırmalı olarak da kullanılabilir. Örneğin Voyant Tools sistemi içerisinde var olan Jane Austen romanlarını kullanırsanız, hangi kelimelerin hangi romanlarda nasıl bir seyirde yani eserin hangi bölümünde ne sıklıkta veya azlıkta kullanıldığını gösteren daha farklı bir grafiği görmeniz de mümkündür. Document Terms aracı ise daha sıklık yüzdesi ve aynı zamanda detaysız bir grafik çubuğu içeren bir araçtır (Ek.10). Bu iki araç da, diğer araçlarda olduğu gibi interaktiftir.



Ek 9

Ek 10


Ekranın sol alt kısmında da üç adet araç yer alıyor. Bu araçlardan ilki olan Summary sekmesi, kolayca anlaşılabileceği üzere eseri yüzeysel olarak ve istatistikî bakımdan özetleyen araçtır. Bu araçta analizde kaç kaynak kullanıldığı, bu kaynağın kaç kelime içerdiğini, kaç tanesinin benzersiz (unique) kelime olduğunun yanı sıra kelime yoğunluğu, okunabilirlik indeksi, cümle başına ortalama kelime ve en sık geçen kelimeler gibi özet bilgiler yer alıyor (Ek.11). Documents aracında analizde kullanılan kaynak ve dökümanların listesi ve bunlar hakkında birtakım bilgi veren bir liste bulunuyor. Phrases aracında ise eserdeki cümleler, belirli istatistikî esaslara göre sıralanmış durumda. Fakat bu aracın bilgisayar okunabilirliği yüksek olmayan birçok PDF temelli dosyada verimli çalışmayabileceğini şimdiden söyleyelim.



Ek 11


Gelelim ekranın sağ alt kısmındaki ve ilk giriş ekranındaki son Voyant Tools araçlarına. Bu kısımda üç farklı araç bulunuyor. Bunlardan ilki Contexts aracı, merkeze alınan bir kelimenin; eserin hangi kısımlarında hangi cümlelerin içerisinde hangi kelimelerle kullanıldığını görmeyi sağlıyor (Ek.12). Yani sık geçen bir kelimenin cümle bağlamını bu şekilde izleyebilirsiniz. İkinci araç olan Bubbleline’da görülebilecek olan şey, kelimeleri büyük-küçük “balonlar” şeklinde, birbirleriyle ilgi ve bağlantı oranına göre bağlayarak oluşturulmuş bir “bağlı balonlar çizgisi”dir (Ek.13). Voyant Tools’un inceleyeceğimiz son aracı ise Correlations (Ek.14). Correlations ile eserde geçen kelimelerin birbirleriyle olan bağıntılarını yani korelasyonlarını, bunun oranlarını ve istatisikî verilerini görebilirsiniz.



Ek 12

Ek 13

Ek 14


Giriş ekranında ilk kez kullanan kullanıcılara sunduğu özelliklerini birlikte incelediğimiz Voyant Tools’un sahip olduğu araçlar bunlarla sınırlı değil. Ekrandaki herhangi bir aracın üstüne geldiğinizde ortaya çıkan dörtlü pencere sekmesine tıklarsanız, kullanılabilir durumdaki birçok Voyant Tools aracını görebilir ve onları aktive ederek kaynağınızı o araçlarla analiz etmeye başlayabilirsiniz.


Voyant Tools sunduğu analiz araçları ile kullanılabilir çıktılar almamızı sağlarken aynı zamanda bunun kullanılabilirlik oranını da önemseyen bir web sitesi. Herhangi bir aracı, başka bir yerde kullanmak istediğimizde yapmamız gereken tek şey ilgili aracın üstüne imleç ile gelerek o aracı aktive etmek. Araç aktif olduğunda üst kısımda açılan sekmelerden paylaşma işareti olan sekmeye bastığımızda, gerek dijital gerekse farklı yöntemlerde veriyi göstermek ve elde etmek için birçok yol olduğunu görebiliyoruz.


Örneğin çalışmamızda oluşturduğumuz kelime bulutunu içeren bağlantıya ulaşmak için tıklayınız.


Ayrıca birlikte kullandığımız örnek üzerinden tüm veriyi ve süreci görmek için tıklayınız.


Voyant Tools oldukça özenli bir rehber eğitim sitesi hazırlamıştır. İngilizce olarak bu eğitimleri takip etmek içın tıklayınız.



Comments


bottom of page