İnsanlar Sahte Haberi Tespit Etmekte Kötü. Peki, Bilgisayar Programları Daha İyisini Yapabilir Mi?

Haber akışı içerisinde gezinmek, çoğu kez iki gerçek ve bir yalan oynuyormuş gibi hissettirir.

Bazı gerçek dışı haberlerin fark edilmesi kolaydır. Tıpkı, First Lady Melania Trump’ın Beyaz Sarayı Obama döneminin uğursuzluklarından arındırmak için kötü ruhları kovan birini aradığı ya da Ohio’da bir okul müdürünün, öğrenci meclisinin gözleri önünde tuvaletini yaptığı için tutuklandığı haberlerinde olduğu gibi. Oysa bazı haberlerde, kurgu, olayın aslının içinde çok iyi yer edinir. CNN Federal Haberleşme Komisyonu tarafından baskına uğradı mı gerçekten ? Polisler gerçekten de Alama Walmart’ın içerisinde bir meth laboratuvarını ortaya çıkardı mı? Kuşkusuz, hayır. Ne var ki, bir dizi hikayenin gerçekle karıştığı bu haber akışı içinde gezinen herhangi biri kolaylıkla kandırılabilir.

Yanlış bilgilendirilmenin altın çağında yaşıyoruz. Twitter’da, doğruluğu olmayan bilgiler gerçeklerden çok daha fazla ve daha hızlı yayılıyor (SN: 3/31/18, p. 14). BuzzFeed News analizine göre, 2016 yılında ABD başkanlık seçimlerine giderken, en popüler sahte yazılar, başlıca en güncel haberlerden daha fazla Facebook paylaşımı, geri bildirimi ve yorumu aldı.

İnternet yaygınlaşmadan önce, “Çatı katında otururken kitlesel ölçekte komplo teorileri oluşturan birilerini bulamazdınız,” diyor California Üniversitesi Santa Cruz’dan bilgisayar uzmanı Luca de Alfaro. Ancak, günümüzün sosyal medyasıyla,yalan söylemek oldukça kolay ister ─ bu yalanlar tıpkı birçok sahte haber web sitesine sahip bir şirket olan Disinfomedia’nın haberleri gibi olsun isterse de Makedonya’da 2016 seçimlerinde popüler sahte haberler yazarak nakit para alan gençleri gibi.

Birçok internet kullanıcısı, doğruluğu olmayan haberleri muhtemelen kasıtlı olarak yayımlamıyor. Bilginin aşırı yüklenmesi ve Web’de gezinen ortalama birinin sınırlı dikkat süresi, gerçekleri denetleme konusunda tetikte olmaya tam olarak uygun değil. Bir yandan, doğrulama sapması da rol oynuyor. İtalya, Venedik’teki Ca’ Foscari Üniversitesi’nde, bilginin sosyal ağlarda nasıl dolaştığı üzerine çalışan bilgisayar bilimci Fabiana Zollo “Filtreden geçirilmemiş bilgilerle uğraşırken, bu bilgiler yanlış olsa dahi, insanların kendi düşüncelerine en uygun olanı seçmeleri olasıdır,” diyor.

Kasten ya da değil, yanlış bilgilerin paylaşılmasının ciddi sonuçları olabilir. Sahte haber sadece seçimlerin doğruluğunu tehdit etmez, bunun yanı sıra gerçek haberlerde de halkın güvenini sarsar. Hayatları tehdit eder. Örneğin, akıllı telefonlara özgü bir mesaj sistemi olan WhatsApp üzerinden yayılan yanlış söylentiler, bu yıl Hindistan’da linç vakalarına yol açarak birçok insanın ölümüne neden oldu.

Sahte haberleri, gerçekten ayırmak için programcılar, çevrimiçi hikayelerin doğruluğunu değerlendiren otomatik sistemler kurmakta. Bir bilgisayar programı, bir makalenin belirli özelliklerini ya da sosyal medyada nasıl karşılandığını göz önünde bulundurabilir. Bazı uyarı işaretlerini tanıyan bilgisayarlar, metindeki bilgilerin doğruluğunu kontrol ederek son onayı verecek olan insanları denetleyebilirler.

Bloomington Indiana Üniversitesi’nden bilgisayar bilimci Giovanni Luca Ciampaglia, otomatik yalan bulma araçları “hala gelişiminin ilk aşamasında” diyor. Araştırmacılar, sahte haberleri en güvenilir şekilde belirleyen etmenleri araştırıyorlar. Ne yazık ki, ellerinde kendi yöntemlerini test etmek için kullanacakları ortak karara bağlanmış bir dizi doğru ve yanlış hikaye yok. Bazı programcılar, hangi haberin doğru olup olmadığını belirlemek için yayın organlarına ya da devlet basın kuruluşlarına güvenirken, diğerleri ise sahte oldukları sosyal medyadan bildirilmiş haberlerin listelerinden yararlandı. Dolayısıyla, bu alanda yapılan çalışmalar herkesin müdahil olabildiği bir durumdu.

Ancak dünyanın dört bir yanındaki ekipler, internetin bir bilgi yangın hortumu olmasından ve insan gerçeklerini kontrol etmelerini istemenin bu hortumu bir Brita filtresine hedeflemek gibi olmasından dolayı yarışta en ileriye geçmeye çalışıyorlar.

En eski ve en kapsamlı çevrimiçi hikaye doğrulama sitesi olan Snopes’ta bilim yazarı olan Alex Kasprak şöyle diyor: “İnternette hakikaten değersiz şeylerin bu denli yer kaplaması… cidden usandırıcı”.

Okur Yönlendirmeleri

Gerçek haber sitelerinin ziyaretçileri daha çok bu sitelere doğrudan ya da arama motoru sonuçlarıyla ulaşır. Oysa sahte haber siteleri, sosyal medyadaki bağlantılar aracılığıyla, gelen web trafiğinin çok daha yüksek bir kısmının dikkatini çekmektedir.

İçerik ve Biçim

Konu haber içeriğinin doğrudan denetlenmesine geldiğinde, anlatının sahtekarlığa yatkın olup olmadığını anlamak için iki ana yol vardır: yazarın ne söylediği ve yazarın nasıl söylediği.

Ciampaglia ve meslektaşları, bu uğraştırıcı görevi, bir ifadenin konusu ve nesnesi ile ne kadar yakından ilişkili olduğunu kontrol eden bir programla otomatikleştirdi. Bunu yapmak için, program her Vikipedi sayfasının sağ tarafında bulunan bilgi kutusundaki gerçek olgulardan oluşturulmuş çok geniş bir ad ağı kullanmaktadır ─ her ne kadar benzer ağlar, araştırma veri tabanları gibi diğer bilgi haznelerinden oluşturulmuş olsa da.

Ciampaglia grubunun isim ağında, eğer bir ad, bir başkasının bilgi kutusunda gözükürse iki ad birbirine bağlanır. Bir ifadenin konusu ile bu ağdaki nesne arasında ayrılık derecesi ne kadar azsa ve konu ile nesneyi birleştiren ara sözcükler ne kadar özgülse bilgisayar programı, olası olarak bir ifadeyi daha doğru olarak etiketlemektedir.

“Barack Obama, Müslümandır.” şeklindeki sahte iddiayı ele alalım. “Obama” ve “İslam” arasındaki adlar ağında, “Kanada” gibi çok genel isimler de dahil olmak üzere, diğer birçok sözcüğe bağlanan yedi ayrılık derecesi vardır.

Bu uzun, dolambaçlı rotayı göz önünde bulundurduğumuzda, 2015 yılında PLOS ONE’da tanıtılan otomatik gerçek denetleyici, Obama’nın Müslüman olamayacağını düşündü.

Dolambaçlı rota

Otomatik bir gerçek ─ denetleyici, “Obama” ve “İslam” sözcükleri arasındaki ayrılık derecelerini Vikipedi bilgisinden yapılan bir ad ağında inceleyerek, “Barack Obama, Müslümandır” ifadesini değerlendirir. Bu iki ad arasındaki oldukça belirtisiz bağlantı, ifadenin yanlış olduğunu göstermektedir.

Ancak, bu tür konu ─ nesne ayrılığına dayanan ifadelerin doğruluğunu tahmin edebilmenin sınırları vardır. Örneğin, sistem eski Başkan George W. Bush’un Laura Bush ile evli olma ihtimalini öngördü. Müthiş. Ayrıca George W. Bush’un, annesi olan Barbara Bush’la da evli olabileceğini kararlaştırdı. Müthişten biraz daha uzak. Ciampaglia ve meslektaşları, programları, ağdaki adlar arasındaki ilişkilere daha incelikli bir bakış açısıyla bakabilsin diye çalışıyorlar.

Bir haberdeki her ifadenin doğrulanması, bir öykünün meşru olduğunu göstermenin tek yolu değildir. Yazı biçimi de kendini ele verebilir. Troy, New York’taki Rensselaer Politeknik Enstitüsü’nden bilgisayar bilimciler Benjamin Horne ve Sibel Adali, Business Insider’ın en güvenilir saydığı medya kuruluşlarından 75 gerçek haberi ve yanıltıcı web sitelerinin kara listesindeki 75 sahte hikayeyi analiz etti. Gerçek haberlerle karşılaştırıldığında, sahte haberler daha kısa ve daha fazla belirteçle daha çok tekrar edilme eğilimindeydi. Ayrıca sahte hikayelerde, daha az alıntı, teknik sözcükler ve adlar vardı.

Bu sonuçlara dayanarak, araştırmacılar, haberlerin doğruluğunu değerlendirmek için sahte haberlerin en güçlü dört ayırt edici etmenini ─ ad sayısı ve alıntı sayısı, laf kalabalığı ve sözcük sayısı ─ kullanan bir bilgisayar programı oluşturdu. Montreal’deki geçen yılın Web ve Sosyal Medya Uluslararası Konferansı’nda takdim edilen program, zamanın yüzde 71’lik diliminde sahte haberden gerçeğine doğru sıraladı (sahte haberlerin gerçekte rastgele sıralanmasını sağlayan program yaklaşık yüzde 50’lik bir doğruluk gösterecektir). Horne ve Adali, doğruluğu artırmak için ek özellikler aramakta.

Ann Arbor’daki Michigan Üniversitesi’nde bir bilgisayar bilimcisi olan Verónica Pérez-Rosas ve meslektaşları, 240 gerçek ve 240 uydurma haberi karşılaştırdı. Tıpkı Horne ve Adali gibi, Pérez-Rosas’ın ekibi de sahte haber yazılarında, gerçek olanlardan daha fazla belirteç buldu. Bu analizde, 23 Ağustos 2017’de arXiv.org adresinde yayınlanan sahte haberlerde de daha olumlu bir dil kullanmaya ve daha kesin bir ifade vermeye yöneliyordu.

Gerçekler ve Yalanlar

Yüzlerce makalenin incelenmesi, gerçek haber ve uydurulmuş haber arasındaki biçem kaynaklı farklılıkları ortaya çıkardı. Sahte hikayeler daha kesin olarak ifade edilirken, gerçek hikayeler daha fazla dil farklılaşması taşıyordu.

Bilgisayarlar, sahte makalelerin hangi yönlerinin hikayelerini ele verdiğini söylemek için insanlara gereksinim duymaz. Riverside, California Üniversitesi’nden bilgisayar bilimci ve mühendis Vagelis Papalexakis ve meslektaşları, hikayelerin ne kadar benzer olduğuna dayanan bir makale önbelleğini gruplara ayırarak başlatılan sahte bir haber bulucu oluşturdular. Araştırmacılar benzerliğin nasıl değerlendirileceğine dair açık talimatlar sağlamadılar. Program, haberleri benzerliklerine göre topladığında, araştırmacılar tüm haberlerin yüzde 5’ini gerçekçi veya yanlış olarak tanımladı. Bu bilgilerden, 24 Nisan’da arXiv.org adresinde açıklanan algoritma, işaretlenmemiş makalelerin geri kalanı için etiketler öngördü. Papalexakis’in ekibi bu sistemi Twitter’da paylaşılan neredeyse 32.000 gerçek ve 32.000 sahte haberde sınadı. Gerçekliğin küçük çekirdeğini besleyen program, diğer hikayelerin yaklaşık yüzde 69’unun doğru bir şekilde etiketini belirledi.

Yetişkin Gözetimi

Yaklaşık yüzde 70’lik bir doğruluk payının olması, haberlerin kendi başına güvenilirliğini inceleyen programlara güvenmek için tek başına yeterli değil. Ancak, sahte bir haber bulucu, tıpkı bir kullanıcı bir Web tarayıcısında şüpheli bir haber açtığında uyarıldığı gibi herhangi bir güvenlik sertifikasına sahip olmayan bir siteyi ziyaret etmek üzerinde olduğunda da benzer bir şekilde uyarılabilir.

Benzer bir ilk adımda, sosyal medya platformları, insan gerçek denetleyicilere göndermek için yanlış bilgi gözlemcilerinin sorgulanabilir hikayeler bulmasına fırsat verirler. Bugün Facebook, kullanıcılarından gelen geribildirimleri değerlendiriyor ─ inandırıcı yorumlarda bulunanlar ya da bir haberin yanlış olduğunu bildirenler gibi – hangi hikayelerin doğruluk kontrolüne gereksinim duyduğunu seçerken. Şirket daha sonra bu hikayeleri doğrulamak için FactCheck.org, PolitiFact veya Snopes’teki profesyonel şüphecilere gönderir. Ancak Facebook sözcüsü Lauren Svensson, Facebook’un sahtekarlıkları bulmada verimini artırması için başka sinyaller kullanmaya açık olduğunu söylüyor.

Bilgisayarlar, sahte haberleri bulma konusunda ne kadar iyi olursa olsun, bu sistemler insan gerçek denetleyicilerin yerini tamamen almamalıdır, diyor Horne. Bir hikayenin yanlış olup olmadığına dair son çağrı, bir bilgisayarın sağlayabileceğinden daha ayrıntılı bir anlayış gerektirebilir.

Imperial College London’da bir bilgisayar bilimci ve ekonomist olan Julio Amador Diaz Lopez, “Büyük gri bir ölçek var” diyor. Bağlamdan çıkarılan gerçekler, propaganda ve dini inançlar gibi doğrulanması neredeyse imkansız olan ifadeleri içeren bu spektrum, bilgisayarların gezinmesi için zor olabilir.

Snopes bilim yazarı Kasprak, gerçek kontrolünün geleceğinin bilgisayar destekli ses transkripsiyonu gibi olacağını tasarlıyor. Öncelikle, otomatik sistem transkripsiyonun kaba bir taslağını çıkarır. Yine de bir insanın hala yazım ve noktalama hataları gibi gözden kaçan ayrıntıları ya da programın yanlış anladığı sözcükleri gözden geçirmesi gerekir. Benzer şekilde bilgisayarların, denetleyebilmesi için şüpheli haber listelerini toplayabildiğini söyleyen Kasprak, neyin doğru olduğunu belirlemede son sözü insanların alması gerektiğini vurguladı.

Gözler Kitlelerde

Algoritmalar, sahte haberleri işaretlemede daha akıllı hale geldiklerinde bile, sahte içerik oluşturucularının suçtan sıyrılamayacaklarının garantisi yok. Eğer bilgisayar programları, aşırı olumlu ya da çok fazla kesinliğe sahip öykülerken kuşku duymak için tasarlanmışsa, yazarlar yazma şekillerini buna göre düzenleyebilirler.

Twitter’da sahte haberler üzerinde çalışan Pekin’deki Beihang Üniversitesi’nden bir ağ bilimci olan Daqing Li, “Sahte haberler, bir virüs gibi, evrim geçirip kendini yenileyebilir” diyor. Neyse ki, çevrimiçi haberler kendi anlatılarının içeriğinin ötesinde incelenebilir. Ayrıca, sahte haberlerin diğer sahte göstergelerinin manipüle edilmesi çok daha zor olabilir- anlaşılacağı üzere, bu hikayelerin izleyici kitlesi sosyal medyaya yöneliyor.

Koyun Sürüsü Olarak İnsanlar

İki felaketle ilgili yanlış söylentileri tartışan Twitter kullanıcılarının çoğunluğu, bu söylentileri yaydıkları tweet’lerini yayınladı. Sadece küçük bir kesim, doğruyu araştırmak veya hikayeler hakkında şüphe uyandırmak için yayınlanmıştı.

Pekin Çin Bilimler Akademisi’nde Bilgisayar Teknolojisi Enstitüsü’nün bilgisayar bilimcisi olan Juan Cao, Twitter’ın Çin’deki sürümü olan Sina Weibo’da, spesifik bir haberle ilgili belirli tweetlerin hikayenin doğru olup olmadığı konusunda iyi bir gösterge olduğunu buldu. Cao’nun ekibi, belirli bir haber etkinliğini tartışan tweetleri toplayabilecek, ardından bu mesajları iki gruba ayırabilecek bir sistem oluşturdu: öyküye destek verenler ve buna karşı çıkanlar. Sistem, bu mesajların güvenilirliğini ölçmek üzere çeşitli etmenleri dikkate almıştı. Örneğin, kullanıcının coğrafi olarak yakın bulunduğu bir konum üzerinde yoğunlaşılmış bir hikaye varsa, bu kullanıcının girişi, daha uzaktaki bir kullanıcının girişinden daha güvenilir olarak görülüyordu. Bir kullanıcı hesabında uzun bir süre hareketsiz kalmış ve tek bir hikayeyle ilgili gönderi paylaşmaya başlamışsa, bu anormal davranış kullanıcının güvenilirliğinin karşısında yer alır. Destekleyici ve şüpheci tweetlerin mizacını tartarak program, belirli bir hikayenin sahte olup olmayacağına karar verdi.

Cao’nun grubu, bu tekniği Çin’in devlet tarafından işletilen Xinhua Haber Ajansı gibi kuruluşlar tarafından tanımlanan 73 gerçek ve 73 sahte hikayede test etti. Algoritma, Sina Weibo’da bu hikayeler hakkında yaklaşık 50.000 tweet inceledi ve sahte haberleri yüzde 84’lük bir orana kadar doğru bir şekilde tanıdı. Cao’nun ekibi, 2016 yılında Phoenix’de Yapay Zeka Gelişimi Konferansı’nda bulguları açıkladı. UC Santa Cruz’un de Alfaro ve meslektaşları Makedonya’da geçtiğimiz yılın Makine Öğrenimi ve İlkeleri ile Veri Tabanlarındaki Bilgi Keşfi Uygulamaları üzerine olan Avrupa Konferansı’nda, aldatmacaların Facebook’ta dolaşan gerçek haberlerden, bu hikayeleri beğenen kullanıcılar sayesinde ayırt edilebileceğini bildirdi.

Bir habere kimlerin tepki verdiğine bakmak yerine, bir bilgisayar hikayenin sosyal medya çevresinden nasıl geçtiğine bakabilir. Li ve meslektaşları sosyal medyadaki haberlerden dallanan yeniden gönderilen ağların biçimlerini inceledi. Araştırmacılar, Weibo’daki yaklaşık 1.700 sahte ve 500 gerçek haber hikayesinin yanı sıra Twitter’daki yaklaşık 30 sahte ve 30 gerçek haber ağının yeniden gönderilen ağları analiz ettiler. Li’nin ekibi, her iki sosyal medya sitesinde de çoğu kişinin gerçek haberleri doğrudan tek bir kaynaktan yayınlanmaya meyilli olmasının yanı sıra, sahte haberlerin yeniden gönderim yapan diğer insanların gönderileriyle daha fazla yayılmaya eğilimli olduğu sonucuna ulaştı.

Li, olası bir haber bülteni ağının “daha çok bir yıldıza benzediğini, oysa sahte haberlerin bir ağaç gibi daha fazla yayıldığını” söylüyor. Bu durum, Li’nin ekibi, haber yayınları gibi iyi bilinen ve resmi kaynakların yayınladığı haberleri gözardı ettiğinde bile geçerlidir. ArXiv.org adresinde 9 Mart’ta bildirilen bu bulgular, bilgisayarların tek tek yazılanları mercek altına almadan bile, sosyal medya katılımını doğruluk için son bir sınav olarak kullanabileceğini gösteriyor.

Dallanma

Twitter’da pek çok kişi gerçek haberleri (kırmızı noktalar) tek bir merkezi kaynaktan (yeşil nokta) alır. Sahte haber, yeniden gönderim yapan diğer paylaşımcılar aracılığıyla daha çok yayılır.

İnsanlar için Gerçek

Yanlış bilgilendirme, sosyal medyada yayılmaya başladığında, bununla başa çıkmanın en iyi nasıl olacağı açık bir soru olarak kaldı. Haber bültenlerinden sahte haberleri öylece temizlemek de muhtemelen izlemeye uygun bir yol değildi. SSON Analytics’teki bir veri analisti olan Murphy Choy, sosyal medya platformlarının, “tıpkı totaliter bir devlet gibi”, ziyaretçileri üzerinde kontrol düzeyi uyguladığını söylüyor. “Dahil olan tüm taraflar için çok rahatsız olacak.”

Platformlar yanlış bilgilendirmelerin üzerine uyarı işaretleri koyabilir. Ancak yanlışlığı onaylı olarak hikayeleri etiketlemek, talihsiz bir “ima edilen gerçeklik etkisi” ne sahip olabilir. Son zamanlarda yapılan araştırmaya göre, insanlar, kontrol edilip edilmedikleri açıkça, yanlış olarak açıkça işaretlenmemiş hikayelere daha fazla güvenebilirler. Sosyal Bilimler Araştırma Ağı’nda geçtiğimiz eylül Kanada’daki Regina Üniversitesi’nden insan davranışları araştırmacısı Gordon Pennycook ve Yale Üniversitesi’nde David Rand tarafından yayınlanan bir araştırmaya göre, insanlar kontrol edilip edilmesine bakmaksızın, açıkça yanlış olarak işaretlenmemiş herhangi bir hikayeye daha fazla güvenebilirler.

Şirket sözcüsü Svensson, hikayeleri kaldırmak yerine Facebook, kullanıcıların haber bültelerinde hikayelerin gerçek yüzünü göstererek, yanlış bir haberin gelecekteki görünümünü yüzde 80 azaltabilir, diyor. Ayrıca Facebook, kullanıcıların ilgili hikayelerle her karşılaşmasında yanlış hikayeleri de önleyen makaleler de gösterir ─ ki bu teknik geri tepebilir. Komplo haberlerini beğenen ve paylaşan Facebook kullanıcıları üzerinde yapılan bir çalışmada, Zollo ve meslektaşı Walter Quattrociocchi, komplocuların kirli çamaşırları ortaya çıkaran haberlerle etkileşimde bulunduktan sonra, bu kullanıcıların Facebook komplo sayfalarında etkinliklerini artırdıklarını buldu. Araştırmacılar bu bulguyu haziran ayında Sosyal Sistemlerde Karmaşık Yayılma Fenomeninde bildirdiler.

Bilgisayarlara ─ ve insanlara ─ sahte haberleri tanımayı öğretmek için hala yapılacak çok iş var. Eski bir deyişin de dediği gibi: “ Doğru ayakkabılarını giyinceye kadar, yalan dünyanın yarısını dolaşabilir.” Ancak, gözü pek bilgisayar algoritmaları, en azından birkaç yeni ayak bağı ile sahte hikayeleri yavaşlatabilir.

Özgün Başlık: People are bad at spotting fake news. Can computer programs do better?

Kaynak: https://www.sciencenews.org/article/can-computer-programs-flag-fake-news

Bunları da sevebilirsiniz

Bir cevap yazın