Bölüm 7: Bilgisayar Topluluklarıyla İnsan Topluluklarını Birleştirmek
Araştırmacı gazeteciler ve insan hakları aktivistleri onyıllar boyunca acil ve flaş haber durumlarında doğrulama için bir çok stratejiden faydalandılar. Kullanıcı üretimi içeriğin gelişimiyle, bu uzmanlık daha da talep edilir hale geldi. Fakat birçoğu, doğrulama sürecini hızlandırmak ve muhtemelen otomatikleştirmek için “ileri programlama”ya eğiliyor. Herhangi diğer teknikler gibi, sosyal medya içeriğini gerçek zamana yakın biçimde doğrulamak üzere gelişmiş programlamayı kullanmanın vaatleri ve güçlükleri var.
İleri programlama iki öğeden oluşuyor: makine kaynaklı programlama ve insan kaynaklı programlama. İlki doğal dil işlemesini (NLP) kullanırken ve makine kaynaklı öğrenimi (MP) kullanırken diğeri kollektif ve mikro-görevlendirmeyi kullanıyor.
İleri programlamanın kullanıcı üretimi içeriği doğrulamak üzere uygulamaları şu an sınırlı çünkü bu araştırma alanı halen yeni ve aşağıda tarif edilen doğrulama platformları ve teknikleri halen geliştiriliyor ve test ediliyor. Bunun sonucunda, doğrulama sürecine ne kadar değer katacaklarını önümüzdeki dönemde göreceğiz ama teknolojik gelişmelerin doğrulama sürecinin unsurlarının otomatikleşmesine yardımcı olacak yeni yollar getirmeye devam etmesi muhtemel.
Bulunduğumuz dönem, ileri programlamanın kullanıcı içeriklerini doğrulamak üzere uygulamaları için önem taşıyor: Bu alanda üç yeni proje geliştiriliyor. Bu bölüm, insan ve makine programlamasının doğrulama sürecinde kullanımı (ve birleşimi) ile ilgili arka planı da kapsayan bir biçimde bu projelere genel bir bakış sunuyor. Detaylara inmeden önce, bir not eklemek isterim: Ben, aşağıda anlatılan dijital insani yardım çabalarına Haiti, Filipinler ve Pakistan’da öncülük ettim. Ayrıca, adları geçen Verily Project’te ve Twitter Güvenilirlik Eklentisi’nin oluşturulmasında da rol aldım.
İnsan kaynaklı programlama
İnsan kaynakı programlama, bir diğer adıyla Kolektif Programlama’da, bir bilgisayar belirli görevleri insanlara ve topluluklara devreder. Bilgisayar, daha sonra işlenen görevleri biraraya getirir ve analiz eder.
İnsan kaynaklı programlamanın acil durumlarda erken dönem kullanımlarından biri 2010’daki Haiti Depremi’ydi.Ushaidi Inc. acil metin mesajlarının Haitian Crole’den İngilizce’ye çevirilmesi için web-tabanlı bir platform hazırladı. Bu mesajlar, Port-au-Prince ve etrafında felaketten etkilenen topluluklardan geliyordu. Çevirisi yapılan metinler daha sonra aciliyetine göre sıralanıyordu ve Ushaidi Haiti Kriz Haritası’na dökülüyordu. Bu metinlerin çevirisi Ushaidi’nin insan kaynaklı programlama platformunu krizle ilgili bilgilerde mikro-görevlendirme yapma amacıyla ilk ve tek kullanımı olmasına rağmen, bu bilişim tekniğinin başarısı onun felaketlerde yardıma kattığı değeri vurguladı.
İnsan kaynaklı programlamanın bir sonraki kullanımı 2012’de Filipinler’deki Pablo Fırtınası’ndaydı. Birleşmiş Milletler’in talebi üzerine, Dijital İnsani Yardım Ağı (DHN) tayfunun karaya ulaşmasından sonraki ilk 48 saat içerisinde atılan tweetleri toparladı ve analiz etti.. Daha spesfik olarak, DHN gönüllülerinin Twitter’a gönderilen, güçlü fırtına ve yağmurun yol açtığı hasarı ortaya çıkaran fotoğraf ve videoları tanımlamaları istendi. Bu işlemi gerçekleştirmek üzere, DHN ücretsiz ve açık kaynak kullanımlı CrowdCrafting mikro-görevlendirme platformunu her bir ayrı görüntü ve tweeti etiketlemek için kullandı. İşlenen veri daha sonra felaketin yol açtığı hasarın kriz haritasını oluşturmak üzere kullanıldı.
Tİnsan kaynaklı programlamayla yardımın Pablo Tayfunu’ndaki bu başarılı kullanımı Micromappers adında yeni ve elverişli bir mikro-görevlendirme platformunun başlatılmasına sebep oldu. CrowdCrafting yazılımını kullanarak geliştirilen MicroMappers Baluchistan Depremi’nden sonra atılan tweetleri ve görüntüleri etiketlemek üzere ilk defa 2013’te kullanıldı.. Bu operasyon, DHN tarafından Pakistan’daki Birleşmiş Milletler’in talebi üzerine gerçekleştirildi.
Özetle insan kaynaklı programlama, insani yardım çevrelerinde yeni yeni kavranıyor ve ilgi görüyor. Fakat, şimdiye kadar sosyal medya içeriğinin doğrulanmasında kullanılmamıştı.
Verily platformu
Gelişimine destek verdiğim Verily platformu makine kaynaklı programlamayı sosyal medyaya yüklenen bilgileri destekleyen ya da doğruluğu hakkında kuşku yaratan verileri kitlesel işbirliğiyle hızla saptamak için kullanıyor. Verily’nin sıklıkla büyük bir afet öncesinde ve sonrasında afet hasarıyla ilgili çelişkili raporların açıklığa kavuşmasına yardımcı olmak üzere kullanılmasını bekliyoruz. Elbette platform görüntüleri ve video çekimlerini doğrulatmak için de kullanılabilir. Verily, Savunmada İleri Araştırma Projeleri Birimi (DARPA) tarafından 2009’da başlatılan Red Baloon Challenge’tan esinlenmişti. Sözkonusu sorun, katılımcıların ABD sınırları içerisinde dikili 10 kırmızı hava durumu balonunun konumunu doğru belirlemesini gerektiriyordu.
MIT (Massachusets Teknoloji Enstitüsü)’nden ödül kazanan takım, bilgisayarlarının başından ayrılmadan dokuz saatten az sürede 10 balonu buldu. İşin aslı, (bu takım üyeleri) insanları harekete geçirmek için sosyal medyaya, özellikle Twitter’a başvurdular. Yarışmanın başında, kazanırlarsa 40.000 $ değerindeki ödülü tümüyle sahiplenmek yerine, kazanımlarını balonların araştırmasına yardımcı olan kişilerle paylaşacaklarını duyurdular. Özellikle, insanları kendi sosyal ağlarının üyelerini aramaya katılmak üzere davet etmeleri için teşvik ettiler: “Her bir balon için, bize doğru koordinatları yollayan ilk kişiye 2000 $ veriyoruz, fakat dahası da var: onu davet etmiş olan kişiye de 1000 $ veriyoruz. Sonra da, davet eden kişiyi davet edene 500 $, onu davet edene de 250 $ veriyoruz, vesaire.. (ve böyle devam edecek)“ diye yazdılar.
Verily platformu aynı teşvik mekaniğini puan formatında kullanıyor. Ancak ülke genelinde balonları aramak yerine, bu platform afet boyunca çok daha küçük bir coğrafi alanı, genel anlamda bir şehri kapsamak üzere paylaşılan sosyal medya raporlarının doğrulanmasına olanak sağlıyor.
Verily’yi Evet/Hayır sorularından oluşan, “pinlenen” parçalardan oluşan bir Pinterest kolajı olarak düşünün. Örneğin: “Brooklyn köprüsü Sandy Kasırgası nedeniyle mi kapatıldı?” Verily kullanıcıları bu doğrulama talebini Twitter’da ve Facebook’ta paylaşıp, yakınlarda yaşayan kişilere de e-posta yollayabilirler.
Soruyu cevaplayacak kanıtları olan kişiler, iki bölümü olan Verily panosuna yazarlar. Bölümlerden biri doğrulanacak soruyu olumlu cevaplayan kanıtlar için, diğeri de olumsuz cevap verenler içindir.
Paylaşılabilecek kanıt çeşitleri, metin, resim ve video formatlarını içeriyor. Verily panosuna konan her bir kanıt, paylaşımı yapan kişiden bu kanıtın neden ilgili ve güvenilir olduğuna dair bir açıklamayla birlikte yer almalıdır/ desteklenmelidir.
Bu biçimde, Verily’nin projesinin bir diğer benzer hedefi de kitlesel işbirliğiyle eleştirel düşünceyi desteklemek. Verily platformunun 2014’ün başında www.Veri.ly adresinde kullanıma girmesi bekleniyor.
Makine kaynaklı programlama
2010’da Şili’yi sarsan 8.8 büyüklüğündeki deprem Twitter üzerinde geniş kapsamlı yer aldı. Hemen her zaman olduğu gibi, kriz durumu tweetlerinin artışıyla birlikte yanlış bilgiler ve söylenti dalgaları ortaya çıktı. Bu söylentilerden biri, Valparaiso’da bir tsunami uyarısıydı. Bir diğeri, Santiago’nun bazı bölgelerinde yağmalanma haberleriydi. Bu türde söylentilerin yayılmasına rağmen, yakın zamanlı deneysel araştırmalar Twitter’in kendini düzeltebilen bir mekanizmaya sahip olduğunu gösterdi. Şili depremi sonrasındaki tweetler üzerinde yapılan bir araştırma araştırma Twitter kullanıcılarının tipik olarak güvenilir olmayan tweetleri güvenilirliklerini sorgulayarak arka plana ittiğini ortaya çıkardı.
Araştırmacılar bu özelliği analiz ederek, tweetlerin güvenilirliğinin tahmin edilebildiğini gösterdi. Konuyla ilgili veri odaklı analiz,belirli özellikleri taşıyan tweetlerin çoğunlukla yanlış olduğunu ortaya çıkardı. Örneğin, tweetlerin uzunluğu, kullanılan sözcüklerin duygu analizi, ve kullanılan etiket ve emoji sayısı, tweetin içinde yer alan mesajların muhtemel güvenilirliğinin göstergelerini sağlıyor. Aynı durum görüntü ve videolara yönlenen linkler içeren tweetlerde degeçerli – multimedia içeriklerine yönlenen linkler içeren tweetlerde kullanılan dil, bu multimedya içeriğinin güvenilir olup olmadığını belirlemek üzere kullanılabilir.
Birlikte değerlendirildiğinde, bu veriler makinelere tweet ve diğer sosyal medya içeriklerinin kesinliğini tahmin etmeye başlamaları için gerekli olan parametre ve “zeka” kriterlerini sağlıyor. Bu, afetlerde, diğer flaş haberlerde ve acil durumlarda doğrulama sürecinde otomasyonun daha büyük bir rol almasına kapıları aralıyor.Kullanışlı uygulamalar bakımından, bu bulgular Twitter’da bir “Güvenilirlik Eklentisi” geliştirmek üzere kullanılıyor..Bu proje, Katar Bilişim Araştırmaları Enstitüsü’ndeki takımım ile Hindistan, Delhi’deki Indraprastha Bilgi Teknolojileri Enstitüsü’nün ortak çalışmasını kapsıyor.
Bu eklenti, birbirinden bağımsız tweetleri belirlenen tweetlerin içeriklerinin güvenilir kabul edilme olasılığına göre 0’dan 100’e uzanan bir ölçekte değerlendirecek. Bu makina kaynaklı programlama çözümünün temel avantajı, tamamen otomatize çalışması, bu yüzden de insan kaynaklı programlama platforumu Verily’den daha ölçeklenebilir olması.
Karma Programlama
Afet Yardımı için Yapay Zeka (AIDR) platformu, insan kaynaklı ve makine kaynaklı programlama modellerinin bir karması olma özelliğini taşıyor.
Platform, insan kaynaklı programlama (ve mikro-görevlendirme) ile makine kaynaklı programlamayı birleştiriyor. Mikro-görevlendirme, kapsamlı bir görevi alıp bu görevi daha küçük görev dizilerine ayırmaktır. Makine öğrenimi ise bir bilgisayara belirlenen bir görevi tamamlamayı öğretmektir.
AIDR kullanıcıların ilgilenilen konuya dair bilgiyi Twitter’da bulmak için bir algoritma öğretmesini sağlıyor. Öğretme işlemi, mikro-görevlendirme kullanılarak yapılıyor. Örneğin, Kızıl Haç bir afet sonrasında altyapı hasarına dair kaynaklar için Twitter’ı izlemekle ilgileniyorsa, bu durumda Kızıl Haç personeli AIDR’in mikro-görevlendirme arayüzünü hasardan bahseden tweetleri seçmek için kullanabilir. Sonrasında algoritma bu süreci öğrenir ve otomatik olarak hasardan bahseden ilave tweetleri bulur.
Bu karma programlama yaklaşımı, söylentileri otomatik olarak bu söylentilerden bahseden başlangıçtaki bir dizi tweete dayanarak belirlemek üzere kullanılabilir. Söylentileri ve kaynaklarını hızla belirlemek kullanıcı tarafından oluşturulan içeriği doğrulamanın önemli bir bileşenidir. Gazetecilerin ve insani yardım profesyonellerinin bilginin kaynağını takip etmelerini ve bilgiyi doğrulamak üzere bir sonraki adımda kiminle iletişime geçileceğini bilmelerini sağlar.
Emin olmak üzere, amaç sosyal medyada sadece yanlış ya da yanıltıcı bilgiyi belirlemek olmamalı, neredeyse gerçek zamanlı olarak bu bilgiye karşılık vermek ve bu bilgiyi düzeltmek olmalı. AIDR’in ilk versiyonu 2013 Kasım’da yayınlandı.
Doğrulama sürecini hızlandırmak
Daha önce belirtildiği gibi ileri programlama ile desteklenen doğrulama platformlarının gelişmeye başlayan süreçleri, onların kullanıcı üretimi içeriği doğrulama için nihai değerlerinin daha yeni yeni görüleceğini gösteriyor. Bu platformlar meyve verse bile, erken dönemde tekrarlı kullanımları önemli sınırlamalarla karşılaşacaktır. Fakat bu erken dönem çalışmaları ileri programlamanın doğrulama süreçlerinde kullanımlarının anlamlı uygulamalarına doğru ilerlemek için önem taşımaktadır.
Güncel bir sınırlama, yukarıda anlatılan AIDR ve sırada bekleyen Güvenilirlik Eklentisi’nin tamamen bir kaynağa, Twitter’a, bağlı olmasıdır. Çapraz-medya doğrulama platformlarının raporları/haberleri kaynaklar, mecralar ve diller arasında üçgenlere bölmesi gerekmektedir. Veri.ly bu ihtiyacı karşılamaya yaklaşsa da, tamamen kolayca ölçeklenemeyen insan veri girişlerine dayanmaktadır.
Herhangi bir olayda, bu çözümler, çoğunluğun aradığı doğrulamanın sihirli değneği olmaktan uzaktır. Diğer bilgi platformları gibi, yeterli zaman ve çabayla onlar da yanlış yönlendirilebilir ve sabotaja uğrayabilir. Yine de, bu araçlar doğrulama sürecini hızlandırma fırsatını taşımaktadır ve bu alanda daha fazla çaba gösterildiğinde ve bu alana yatırım yapıldığında muhtemelen ilerleyecekler.