Yapay Zeka – sözlük olmaksızın – Çift Dilli Oluyor

Özgün Başlık: Artificial intelligence goes bilingual—without a dictionary

Yazar: Matthew Hutson

28 Kasım 2017

Kaynak: Science Mag, http://www.sciencemag.org/news/2017/11/artificial-intelligence-goes-bilingual-without-dictionar

Yapay Zeka – sözlük olmaksızın – Çift Dilli Oluyor

Sinir Ağları – insan beyninden esinlenen bilgisayar algoritmaları – sayesinde otomatik dil çevirisinde uzun mesafe alındı. Fakat bu türden ağları eğitmek için muazzam miktarda veri gerekmekte: Bir insanın çeviriyi nasıl yapacağını gösterebilmek için milyonlarca cümle-cümle çeviri bilgisi gerekmekte. Şimdiyse, iki yeni makale, sinir ağlarının paralel metinler olmaksızın çeviri yapmayı – pek çok dilde belgeleri erişilir kılacak şaşırtıcı bir gelişme – öğrenebileceğini gösteriyor.

İspanya San Sebastian’daki Basque Bölge Üniversitesi’nden (UPV) bilgisayar bilimci olan ve çalışmalardan birinin birinci yazarı Mikel Artetxe şöyle diyor: “Birisine – hiçbiri bir diğeriyle örtüşmeyen – pek çok Çince kitabı ve pek çok Arapça kitabı verdiğinizi ve bu kişinin Çince’den Arapça’ya çeviri yapması gerektiğini hayal edin. Bu imkansız görünüyor, değil mi? Fakat biz bir bilgisayarın bunu yapabileceğini gösterdik.”

Makine öğrenme uygulamalarının çoğu – sinir ağlarının ve diğer bilgisayar algoritmalarının deneyimden öğrendiği uygulamaların – “denetim altında” olmaktadır. Bilgisayar bir tahminde bulunup, doğru yanıtı alır ve sürecini bu yanıta uygun olarak ayarlar. Bu, örneğin, İngilizce Fransızca arası çeviriyi bilgisayara öğretirken gayet iyi işler, çünkü birçok belge her iki dilde de bulunur. Ender diller için veya çokça paralel metni olmayan daha popüler diller için bu pek işlemez.

Sözü edilen ve her ikisi de gelecek yılın Öğrenme Temsilleri Üzerine Uluslararası Konferans’a (International Conference on Learning Representations) gönderilmiş fakat henüz hakem değerlendirmesinden geçmemiş olan iki makale, başka bir yönteme odaklanmaktadır: Denetimsiz Makine Öğrenme (unsupervised machine learning). İlkin, her bir çalışmada, tahminleri doğru olduğunda bunu onlara söyleyen insan bir öğretmenin yardımı olmaksızın çift dilli sözlükler oluşturmaktadır. Sözcüklerin bir araya gelme tarzlarındaki yakından benzerliklerin bulunması nedeniyle, bunu yapmaları mümkündür. Masa ve sandalye için kullanılan sözcükler, örneğin, tüm dillerde sıklıkla birlikte kullanılırlar. Dolayısıyla, şayet bir bilgisayar bu birlikte belirişleri, sözcükler şehirler olacak şekilde devasa bir yol haritasıymışçasına haritalandırırsa, farklı diller için olan haritalar birbirine benzeyecektir, yalnızca farklı adlarla. Böylece, bilgisayar, bir haritayı diğerinin üstüne çakıştırmak için en iyi yolu bulabilir. İşte! Artık bir çift dilli sözlüğe sahipsiniz.

Önemli derecede benzer yöntemleri kullanan sözü edilen yeni makalelerin yöntemleriyle, cümle düzeyinde de çeviri yapılabilmektedir. Her ikisi de, “geri çeviri” ve “gürültü arındırma” denen iki eğitim stratejisini kullanıyor. Geri çeviride, bir dildeki bir cümle diğerine kabaca çevrilip, ardından eski dile geri çevrilmektedir. Şayet geri çevrilmiş cümle, özgün cümleyle özdeş değilse, sinir ağları, bir sonrakinde çevirinin daha yakın olabilmesi için ayarlanır. Gürültü arındırma, geri çeviriye benzer, fakat bir dilden diğerine sonra tekrar öncekine geri gitmek yerine, cümleye (sözcükleri yeniden düzenleyerek veya kaldırarak) gürültü ekleyip bu cümleyi özgün haline geri çevirmeye çalışır. Bu yöntemler, birlikte, ağlara dilin daha derin yapısını öğretirler.

Söz konusu teknikler arasında ufak farklılıklar bulunmaktadır. UPV sistemi eğitim sırasında geri çevirmeyi daha sıklıkla kullanır. Facebook bilgisayar bilimcisi olan ve Pennsylvania’da Pittsburgh’da bulunan Guillaume Lample ve çalışma arkadaşları tarafından yaratılmış diğer sistemde, çeviri sırasında fazladan bir adım daha ekleniyor. Her iki sistem de, bir dildeki bir cümleyi diğer dilde deşifre etmeden önce, daha soyut bir temsilde şifreliyor, fakat Facebook sistemi, bu ara “dil”in hakikaten soyut olduğunu doğruluyor. Hem Artetxe hem de Lample çalışmalarını, diğer makalenin tekniklerini uygulayarak geliştirebileceklerini söylüyor.

İki makalenin arasında doğrudan yapılan tek karşılaştırmanın sonuçlarında – yaklaşık 30 milyon cümle arasından çekilen aynı kümenin İngilizce ile Fransızca arasında çevrilmesinde – her ikisi de her iki yöndeki çeviri için de çift dilli değerlendirme sonucunda (çevirinin isabetini ölçmek için kullanılan bir puanlamada) yaklaşık 15 puana ulaştı. Bu, yaklaşık 40 puan alan ve denetimli bir yöntemi olan Google Translate kadar veya 50 puandan fazla alabilen insanlarınki kadar yüksek bir sonuç değil, fakat sözcük düzeyindeki (mot-a-mot) bir çeviriden daha iyi. Yazarlar, sistemlerin, yarı denetimli olarak – eğitimlerine birkaç bin paralel cümlenin eklenmesiyle – kolaylıkla geliştirilebileceğini söylüyor.

Çokça paralel metne sahip olmayan diller arasındaki çeviriye ek olarak, hem Artetxe hem de Lample, şayet paralel metinlerin tamamı aynı türdense, örneğin gazete haberi gibi ama yeni bir alana, sokak dili veya tıp jargonu gibi, çeviri yapmak istiyorsanız sistemlerinin İngilizce ile Fransızca gibi genel eşleşmelerde yardımcı olabileceğini söylüyorlar. Fakat Artetxe’nin makalesinin yazarlarından Eneko Agirre uyarıyor: “bu henüz çocukluk çağında… yeni bir araştırma yolunu daha yeni açtık, dolayısıyla bu yolun nereye çıkacağını bilmiyoruz.”

Çalışması her iki makaleyi de etkilemiş olan ve Pekin’deki Microsoft’ta çalışan bilgisayar bilimcisi Di He şöyle diyor: “bilgisayarın, insan denetimi olmadan da çevirmeyi öğrenebiliyor olması şoke edici.” Artetxe, kendi yöntemi ile Lample’ınkinin – arada bir gün farkla arXiv’e yüklenen yöntemlerin – bu denli benzer olmasının şaşırtıcı olduğunu söylüyor: “Fakat aynı zamanda, harika. Bu, çalışmanın gerçekten de doğru bir yöne yöneldiği anlamına geliyor.”

Bunları da sevebilirsiniz

Narsisizmin Köleleri ve Efendileri

“Seçeneksizlik” ve Gelecek

Dil Bilinci ve Mantık

Bir cevap yazın Cevabı iptal et