Yapay zeka sohbet robotları (Chatbot), teknoloji standartlarına nazaran nispeten eskidir. Lakin işin içine yapay zekayı tam manasıyla sokan OpenAI’nin ChatGPT’si, Microsoft’un Bing’i ve Google’ın Bard’ı liderliğindeki en yeni sistemler, her vakit olumlu nedenlerle olmasa da daha evvelki örneklere nazaran çok daha yetenekli olduklarını kanıtlıyor.
Yapay zeka gelişimindeki son atılımlar, şimdiden yanlış bilgilendirme, dezenformasyon, intihal ve makine tarafından üretilen makûs emelli yazılımlar hakkında telaşlar yarattı. Üretken yapay zekanın ortalama bir internet kullanıcısının mahremiyeti için nasıl problemler oluşturabileceği sorusunun yanıtı ise uzmanlara nazaran büyük ölçüde bu robotların nasıl eğitildiği ve onlarla ne kadar etkileşim kurmayı planladığımızla ilgili.
YAPAY ZEKA SOHBET ROBOTLARI VE COMMON CRAWL
Yapay zeka sohbet robotları, insan gibisi etkileşimleri taklit etmek için, değerli bir kısmı Common Crawl üzere depolardan türetilen büyük ölçüde bilgi üzerinde eğitilir.
Chip’in de aktardığı üzere Common Crawl, açık web’i gezerek yıllar boyunca petabaytlarca bilgi topladı. Stanford’un bilgisayar bilimi kısmında doktora öğrencisi ve Microsoft Research’te eski yapay zeka asistanı olan Megha Srivastava, “Bu modeller, internetteki halka açık dataların büyük data kümeleri üzerinde eğitim veriyor” diyor. Srivastava’nın söylediğine nazaran ChatGPT ve Bard, Common Crawl’ın bilgilerinin “filtrelenmiş” bir kısmını kullansalar da, modelin devasa boyutu “birinin dataları büsbütün inceleyip sterilize etmesini” imkansız kılıyor.
Ortalama bir kullanıcı için erişimi güç olan ve internetin uzak köşelerinde bulunan dikkatsizce oluşturulmuş yahut düşük güvenliğe sahip bilgilerin bir eğitim setine fark edilmeden yerleştirilmiş olması ve sohbet robotu tarafından gelecekte tekrar edilmesi mümkün.
Bir botun birinin gerçek irtibat bilgilerini vermesi, hiçbir formda olmayacak bir şey değil. Bloomberg köşe müellifi Dave Lee, Twitter’da birisi ChatGPT’den şifreli iletileşme platformu Signal’de sohbet etmesini istediğinde, gerçek telefon numarasını tam olarak verdiğini bildirdi. Bu çeşit bir etkileşim muhtemelen uç bir durum olsa da bu öğrenme modellerinin erişebildiği bilgilerin dikkate kıymet olduğunu vurguluyor.
Ayrıca bu chatbot’lar, sizin onlara sunduğunuz bilgileri de öğrenme sürecine dahil edebiliyor. Yani siz bir bilgiyi onunla paylaştığınızda, o bu dataları diğer birinin karşısına çıkartabiliyor. Birebir Samsung çalışanlarının başına geldiği üzere…
SANS Enstitüsü güvenlik tertibinden David Hoelzer, Engadget’e “OpenAI’nin sıhhat bilgileri üzere makul bilgileri toplamak ve modellerini eğitmek için bireylere atfetmek istemesi pek muhtemel değil” dedi ve ekledi: “Ama ezkaza orada olabilir mi? Katiyetle…”
Kısacası yapay zeka sohbet robotları hakkımızdaki açık bilgileri toplayabildiği üzere, onlarla paylaştığımız şeyleri de kendi eğitimleri için kullanabiliyor. Bu da, bu robotları kullanan rastgele birinin, bize ilişkin datalara tesadüf yapıtı ya da şuurlu olarak ulaşma ihtimali olduğunu gösteriyor.
Open AI, ChatGPT tarafı için bilgi kapalılığını korumak maksadıyla hangi tedbirleri aldığını yahut eğitim setlerine yerleşmiş olabilecek ferdî olarak tanımlanabilir bilgileri nasıl ele aldığını açıklamamış olsa da, ChatGPT’nin kendisi “kullanıcıların kapalılığını ve şahsî bilgilerini koruyan etik ve yasal standartları takip edecek biçimde programlandığını” ve “(kendisine) sağlanmadığı sürece şahsî bilgilere erişimi olmadığını” söylüyor.
Google, ferdî olarak tanımlanabilir bilgilerin sohbetler sırasında paylaşılmasını önlemek için Bard’da benzeri “korkuluklar” bulunduğunu söylüyor. Bard’ın özel bir saklılık siyaseti bulunmuyor ve bunun yerine öbür Google eserleri tarafından paylaşılan kapsamlı kapalılık dokümanını kullanıyor.