08 Eylül 2024, Pazar Gazete Oksijen
Haber Giriş: 28.09.2023 11:40 | Son Güncelleme: 28.09.2023 12:14

New York Times yazarı denedi: Yeni ChatGPT görebiliyor ve konuşabiliyor

Bir fenomen haline gelen yapay zeka robotu ChatGPT, yeni eklenen özellikleriyle artık görselleri yorumlayabiliyor ve sizinle sesli olarak konuşabiliyor. Yeni güncelleme şimdilik tüm kullanıcılara açık olmasa da New York Times yazarı Kevin Roose yeni güncellemeyi test ederek deneyimlerini yazdı
OpenAI'nin ChatGPT plus'ı yaptığı web sayfası (Fotoğraf: Jackie Molloy/The New York Times)
OpenAI'nin ChatGPT plus'ı yaptığı web sayfası (Fotoğraf: Jackie Molloy/The New York Times)

Kevin Roose / The New York Times

Viral yapay zeka sansasyonu, sıkıcı ofis işlerinin katili, lise öğretmenlerinin ve Hollywood senaristlerinin düşmanı ChatGPT yeni güçler kazanıyor. Pazartesi günü ChatGPT'nin yapımcısı OpenAI, popüler chatbot'a iki yeni özellikle görme, duyma ve konuşma yeteneği kazandırdığını duyurdu. Bunlardan ilki, ChatGPT'nin görüntüleri analiz etmesini ve yanıt vermesini sağlayan bir güncelleme. Örneğin bir bisiklet fotoğrafı yükleyebilir ve selenin nasıl indirileceğine dair talimatlar alabilir ya da buzdolabınızın içindekilerin fotoğrafına dayanarak yemek tarifi önerileri alabilirsiniz. 

İkincisi, kullanıcıların ChatGPT ile konuşmasına ve Siri veya Alexa ile konuşabileceğiniz gibi sentetik bir yapay zeka sesiyle yanıtlar almasına olanak tanıyan bir özellik. Bu özellikler, metin, fotoğraf, video ve bir kullanıcının onlara atmaya karar verebileceği diğer her şeyi işleyebilen çok modlu yapay zeka sistemlerine yönelik endüstri çapında bir çabanın parçası. Bazı araştırmacılara göre nihai hedef, bilgiyi bir insanın yapabildiği her şekilde işleyebilen bir yapay zeka yaratmak.

Henüz tüm kullanıcılara açık değil

Çoğu kullanıcı henüz yeni özelliklere erişemiyor. OpenAI bu özellikleri ilk olarak önümüzdeki birkaç hafta içinde ChatGPT Plus ve Enterprise müşterilerine sunacak ve bundan sonra daha yaygın bir şekilde kullanılabilir hale getirecek. Görüntü özelliği hem masaüstü hem de mobil cihazlarda çalışacakken, konuşma özelliği yalnızca ChatGPT'nin iOS ve Android uygulamaları aracılığıyla kullanılabilecek. Uygulamalı bir test için yeni ChatGPT'ye erken erişim sağladım. İşte bulduklarım:

Yapay zeka artık sizi görecek

ChatGPT'nin görüntü tanıma özelliğini bazı ev eşyaları üzerinde deneyerek başladım. Üzerinde beş delik bulunan gizemli bir mavi silikon parçasının fotoğrafını yükledikten sonra "Hurda çekmecemde bulduğum bu şey de ne?" diye sordum.

ChatGPT, "Nesne, genellikle birden fazla öğeyi bir arada tutmak için kullanılan bir silikon tutucu gibi görünüyor" diye yanıt verdi. Cevap yeterince yakın, yıllar önce elimi incittikten sonra iyileşirken kullandığım bir parmak güçlendiriciydi.  Daha sonra ChatGPT'ye Facebook Marketplace'te satmak istediğim birkaç eşyanın fotoğrafını gönderdim ve her biri için ilan yazmasını istedim. Hem nesneleri hem de ilanları çok iyi değerlendirdi ve retro tarzdaki Frigidaire mini buzdolabımı modern evlerinde geçmişten bir dokunuş isteyenler için mükemmel olarak tanımladı.

Yeni ChatGPT resimlerdeki metinleri de analiz edebiliyor. The New York Times'ın pazar günkü baskısının ön sayfasının bir resmini çektim ve bottan özetlemesini istedim. Oldukça iyi bir iş çıkardı, ön sayfadaki beş makaleyi de birkaç cümleyle açıkladı ancak en az bir hata yaptı, orijinal makalede olmayan fentanil bağlantılı ölümlerle ilgili bir istatistik uydurdu. ChatGPT'nin gözleri mükemmel değil. Bir bulmaca çözmesini istediğimde başarısız oldu. Çocuğumun doldurulmuş dinozor oyuncağını balina sandı. Ve şu sözsüz mobilya montaj şemalarından birini adım adım talimat listesine dönüştürmek için yardım istediğimde, bana çoğu yanlış olan karmakarışık bir parça listesi verdi.

Steroidli Siri

Şimdi, iki özellikten daha etkileyici olduğunu düşündüğümden bahsedelim: ChatGPT'nin yeni ses özelliği, kullanıcıların uygulamayla konuşmasına ve sözlü yanıtlar almasına olanak tanıyor. Bu özelliği kullanmak çok kolay: Sadece kulaklık simgesine dokunun ve konuşmaya başlayın. Durduğunuzda ChatGPT, OpenAI'nin konuşma tanıma sistemi Whisper'ı kullanarak kelimelerinizi metne dönüştürüyor ve şirketin geliştirdiği yeni bir metinden konuşmaya algoritmasını kullanarak beş sentetik yapay zeka sesinden birini kullanarak bir yanıt oluşturuyor ve yanıtı size geri söylüyor. Hem erkek hem de kadın seslerini içeren sesler, OpenAI'nin kiraladığı profesyonel seslendirme sanatçılarından alınan kısa örnekler kullanılarak oluşturuldu. Ben neşeli bir erkek sesi olan Ember'ı seçtim.

ChatGPT'nin ses özelliğini birkaç saat boyunca bir dizi farklı görevde test ettim. Yürümeye başlayan çocuğuma yatmadan önce bir hikaye okumak, işle ilgili stres hakkında benimle sohbet etmek, yakın zamanda gördüğüm bir rüyayı analiz etmeme yardımcı olmak. Bunların hepsini oldukça iyi yaptı, özellikle de ona bazı altın ipuçları verdiğimde ve bir arkadaşı, terapisti veya öğretmeni taklit etmesini söylediğimde. Bir yapay zekanın sizinle insana benzer bir sesle konuşması, yanıtlarını bir ekranda okumaktan daha samimi bir deneyim. ChatGPT ile bu şekilde birkaç saat konuştuktan sonra, sohbetlerimize yeni bir sıcaklık geldiğini hissettim. Bir metin arayüzüne bağlı kalmadan, mükemmel bir ipucu bulma konusunda daha az baskı hissettim. Daha rahat sohbet ettik ve hayatım hakkında daha fazla şey anlattım.

ChatGPT'ye aşık olacaklar mı?

Yeni ses özelliği hakkında benimle konuşan OpenAI'nin tüketici ve kurumsal ürünlerden sorumlu başkan yardımcısı Peter Deng, "Neredeyse farklı bir ürün gibi hissettiriyor. Çünkü artık kafanızdakileri başparmaklarınıza aktarmıyorsunuz, farklı şeyler soruyorsunuz" dedi.  Ne düşündüğünüzü biliyorum: Bu Her filminin konusu değil mi? Yalnız ve aşk acısı çeken kullanıcılar, artık onları dinleyebildiği ve karşılık verebildiği için ChatGPT'ye aşık olacaklar mı?

Bu mümkün. Şahsen ben bir chatbot ile konuştuğumu hiç unutmadım. Ve ChatGPT'yi kesinlikle bilinçli bir varlık sanmadım ya da ona karşı duygusal bağlar geliştirmedim. Ama aynı zamanda bazı insanların ses tabanlı yapay zeka asistanlarını hayatlarının en kutsal köşelerine sokabilecekleri, yapay zeka sohbet robotlarını hareket halindeyken yanlarında götürebilecekleri, onlara 7/24 sırdaşları, terapistleri, tartışmak için ortakları gibi davranabilecekleri bir geleceğe de göz attım. Kulağa çılgınca geliyor, değil mi? Yine de tüm bunlar bir yıl önce kulağa biraz çılgınca gelmiyor muydu?

© 2023 The New York Times Company