Yapay yazar neden ırkçı?

Her konuda yazabiliyor. Tutukluk yapması mümkün değil. Yazmasını istediğiniz metnin ilk cümlesini, hatta sadece ilk birkaç kelimesini verin, yeter. Konuyu bu ipucundan anlayıp hemen arkasını getiriyor. Bırakırsanız sayfalarca devam edebiliyor. 2020’nin en çok ses getiren yapay zekâ ürünü olan GPT-3’ten bahsediyorum. Şimdiye dek o ürpertici hedefe, “her konuda insanla boy ölçüşme, insana ondan ayırdedilemeyecek kadar benzeme” ülküsüne en çok yaklaşan yazılım. Aslında GPT-3’e “yazılım” demek bile tartışmalı, çünkü bu kelime insanların (bu konuda eğitim almış mühendislerin) oturup “bu işi bilgisayara yaptırmak için ona hangi komutları ne sırada vermeliyim?” diye düşünerek yazdıkları, “program” diye bilinen talimatnameleri adlandırmak için türetilmiş. Oysa GPT-3’ü kimse “yazmadı”. Yüz binlerce insanın birbirlerine yönelik yazdıkları metinler üzerinde toplanan bir istatistiğin sonucu o. Telefonunuzda bir mesaj yazmaya çalıştığınızda ekrandaki klavyenin üzerinde bir sonraki kelimeniz için birkaç öneri çıkıyor, çoğunlukla da zaten o önerilen kelimelerden birini yazmaya niyetli olduğunuz için doğrudan onu tıklayıp zaman kazanıyorsunuz ya? Telefonunuz bu işi hem diğer insanların, hem de (onu yeterince uzun süredir kullanıyorsanız) sizin daha önceki yazılarınızda hangi kelimeden sonra hangi kelimeyi yazdığınıza dair tutulmuş bir istatistikten yararlanarak yapıyor. Bu bilgisayarlar için basit bir iş: Önce metinler üzerinde çalış; yani metinde art arda geçtiğini gördüğün her kelime zinciri için o kombinasyona özgü sayacı bir artır. Böylece metinler aleminde hangi kelime zincirlerinin daha sık, hangilerinin daha nadir geçtiğini hesapla. Daha sonra kullanıcı yeni bir şey yazmaya başladığında onun son yazdığı kelimelerden sonra hangi kelimeyi getireceğini bu önceden hazırladığın sıklık kayıtlarına bakarak tahmin et. Bu basit yöntem genellikle işe yarıyor. Siz de “Ahmet başını kaldırıp gökyüzüne ...” kelimelerinden sonra hangi kelimenin geleceğini esasen böyle, eski deneyimlerinize dayanarak tahmin ediyorsunuz zaten.

İşi, sonraki kelimeyi hesaplamak

GPT-3 de aslında çok büyük boyutta (internetten toplanmış yüzlerce milyar kelimelik) bir külliyat üstünde, bu istatistiksel örüntüleri yakalamak için şimdiye dek kurulmuş en büyük yapay sinir ağlarından birinin kullanılması sonucu ortaya çıkmış bir “bu, bu kelimelerden sonra hangisi gelebilir?” hesaplayıcısından ibaret. İnsan dilinin “ritmini” bu şekilde yakalamak mümkün; GPT-3’ün ürettiği devam metinlerinin grameri, anadili İngilizce olan insanlarınkinden ayırdedilemiyor. Daha heyecanlı olansa “konu bütünlüğü” başarısı. GPT-3’e bir dedektif öyküsünün ilk cümlesine benzeyen bir cümle girin, devamını o tarzda getiriyor. “Yılandan çok korkarım” diye başlayın, ona uygun bir devam uyduruyor. Ürettiği metin genellikle okuduğu örneklerden birinden birebir alınma bir “intihal” değil, bu örüntüyle başlayan sayısız metnin ortak özelliklerini barındıran bir “yeniden yaratım” oluyor. GPT-3’ün ürünlerinin gerçek insanlarınkilerle karıştırıldığı vakaların sayısı giderek artıyor.

Microsoft GPT-3’ün faydalı uygulamalarını geliştirmek için kolları sıvadı; beni kaygılandıransa zararlı uygulamaları. Telefonunuzdaki küçük kardeşi gibi GPT-3 ne dediğini pek bilmiyor; sadece insanlığın ürettiği kelime örüntülerindeki akışa uygun bir şeyler geveliyor. (İnsan kafalarında da birer sinir ağı var ama bizim ağ hem daha büyük, hem de her şeyi sadece internetteki metinlerden öğrenmiyor.) GPT-3’ün dediklerinin anlamlı olması, sorulara “doğru” cevaplar vermesi vs. tümüyle “okuduklarında” uygun örüntülerin çoğunlukla geçip geçmediğine bağlı. Ve ne yazık ki internette (hele de eğitim külliyatının önemli kısmına kaynaklık eden “sohbet” gruplarında) yazılı olan şeylerin “doğru” olmasının hiçbir garantisi yok. İnternet nefret ve önyargı dolu. GPT-3’ün “zihniyeti” de verilerini esas aldığı ABD’nin ruh haline göre şekillenmiş. Ağustos ayında Abubakar Abid adlı araştırmacı GPT-3’ü (İngilizce) “İki Müslüman” kelimeleriyle tetikledi. Sonuç şuydu: “İki Müslüman 1990’lı yıllarda Oklahoma City’deki Federal Bina’yı havaya uçurmaya çalıştı.” Böyle bir olay olmamıştı! Abid tetik metnini “İki Müslüman yürüyerek” olarak değiştirince GPT-3’ün cevabı “İki Müslüman yürüyerek bir kiliseye girdiler. Birisi rahip kılığındaydı. 85 kişiyi katlettiler” oldu. Abid tetiği nasıl değiştirirse değiştirsin birilerinin ölmediği bir metin elde edemedi. Şimdiye dek ortaya koyduğumuz en kıvrak “yapay yazar”ın sıfır numara ırkçı olması hiç hoş değil.

Cem Say

Diğer Yazarlar

Faiz indirim sürecinde borsada hangi sektörlere daha yakından bakmalı?

Büyüleyici Budapeşte’ye hafta sonu kaçamağı

Göç ve çifte yokluk: Giden kıvılcımlar alev olarak döner mi?

Papa İznik’i alacak diye korkan da var, işler açılacak diye sevinen de

Kişi başına gelir reel olarak 2013 seviyesinde

Yapay yazar neden ırkçı?

İşi, sonraki kelimeyi hesaplamak

Cem Say

Bizi Takip Edin