Wikimedia Vakfı, açık bilgiye ücretsiz erişimi sürdürürken, yapay zeka şirketlerinin veriye ulaşma açlığıyla da mücadele ediyor. Özellikle Wikimedia Commons üzerinden yapılan multimedya indirmelerinde son aylarda yaşanan yüzde 50'lik artışın nedeni bireysel kullanıcılar değil, otomatik botlar. Bu durum, hem sistemin kaynaklarını tüketiyor hem de maliyetleri artırarak açık bilgi paylaşımının sürdürülebilirliğini tehdit ediyor.

Yapay zeka, internet sitelerin yüksek miktarda veri çekiyor

Wikipedia en önemli bilgi paylaşım sitesi olma özelliğini halen elinde bulunduruyor. Bu projenin çatı kuruluşu olan Wikimedia Vakfı, Çarşamba günü yaptığı açıklamada, Wikimedia Commons üzerinden yapılan multimedya indirmelerinde Ocak 2024'ten bu yana yüzde 50 oranında bir bant genişliği artışı yaşandığını belirtti. Şirket söz konusu artışın nedeninin bireysel kullanıcılar değil, yapay zeka modellerini eğitmek isteyen otomatik botlar olduğunu açıkladı. Web kazıma denilen web scraping işlemi, internet sitelerinden veri çekme işlemi olarak biliniyor. Genellikle bir otomasyon aracı veya bilgisayar yazılımı aracılığıyla gerçekleştirilen işlemin amacı web sitelerindeki metin, görüntü, bağlantı, veri tabanlarından veri ve diğer bilgileri almak amacıyla internet üzerindeki çeşitli kaynaklardan bilgi toplamak.

Wikimedia Vakfı, botların trafiğini engellemek için ciddi bir kaynak harcıyor

Wikimedia Vakfı'nın yayınladığı blog yazısında şu ifadelere yer verildi:

Ukrayna-Rusya savaşına Çin de dahil oldu: 2 asker esir alındı! Ukrayna-Rusya savaşına Çin de dahil oldu: 2 asker esir alındı!

"Altyapımız, yüksek ilgi çeken olaylar sırasında insanlardan gelen ani trafik artışlarını sürdürecek şekilde inşa edildi. Ancak kazıyıcı botlar tarafından üretilen trafik miktarı benzeri görülmemiş düzeyde, artan riskler ve maliyetler doğuruyor." 

Wikimedia'ya göre "Gerçek birey okuyucular belirli konulara odaklanma eğilimindeyken, tarayıcı botlar çok sayıda sayfayı toplu okuma eğiliminde. Wikimedia Vakfı'nın site güvenilirliği ekibi, normal kullanıcılar için bir kesinti yaşanmaması adına botları engellemek için ciddi zaman ve kaynak harcamak zorunda kalıyor. Üstelik bu durumun meydana getirdiği bulut bilişim maliyetleri henüz hesaba katılmış değil. Bu, aslında açık internetin varlığını tehdit eden bir konunun parçası. 

Kaynak: Haber Merkezi