03 Mayıs 2024, Cuma Gazete Oksijen
Haber Giriş: 25.09.2023 21:00 | Son Güncelleme: 26.09.2023 14:44

The New York Times yazdı: ChatGPT konuşmayı da söktü

Kullanıma sunulduğu ilk günden bu yana hızla gelişen ChatGPT sonunda konuşmayı da söktü. The New York Times, görsellere yanıt verebilen ChatGPT'nin insanlarla olan yeni etkileşim düzeyini masaya yatırıp ortaya çıkan fırsatları vurgularken, öte yandan madalyonun karanlık yüzüne de dikkat çekti
Fotoğraf: Jackie Molloy / The New York Times
Fotoğraf: Jackie Molloy / The New York Times

Cade Metz - Brian X. Chen - Karen Weise / The New York Times

San Francisco'lu yapay zeka girişimi OpenAI, Pazartesi günü popüler sohbet robotunun insanlarla sözlü kelimeler kullanarak etkileşime girebilen bir versiyonunu yayınladı. Amazon'un Alexa'sı, Apple'ın Siri'si ve diğer dijital asistanlarda olduğu gibi, kullanıcılar ChatGPT ile artık konuşabiliyor.

Görsellere de yanıt veriyor

ChatGPT ayrıca ilk kez görsellere de yanıt verebiliyor. Örneğin, insanlar buzdolaplarının içinin bir fotoğrafını yükleyebilirken, chatbot onlara sahip oldukları malzemelerle pişirebilecekleri yemeklerin bir listesini verebiliyor.

OpenAI'nin tüketici ve kurumsal ürünlerden sorumlu başkan yardımcısı Peter Deng, "ChatGPT'nin kullanımını daha kolay ve daha yararlı hale getirmek istiyoruz" dedi. OpenAI, son haftalarda yapay zeka araçlarının piyasaya sürülmesini hızlandırdı. Bu ay, DALL-E görüntü oluşturucusunun bir versiyonunu tanıttı ve aracı ChatGPT'ye kattı.

ChatGPT Kasım ayında piyasaya sürüldükten sonra yüz milyonlarca kullanıcının ilgisini çekmiş ve kısa süre içinde başka şirketler de benzer hizmetler sunmaya başlamıştı. Botun yeni versiyonuyla OpenAI, Google Bard gibi rakip sohbet botlarının ötesine geçerken, Alexa ve Siri gibi eski teknolojilerle de rekabet ediyor.

Alexa ve Siri uzun zamandır akıllı telefonlar, dizüstü bilgisayarlar ve diğer cihazlarla sözlü kelimeler aracılığıyla etkileşim kurmanın yollarını sunuyor. Ancak ChatGPT ve Google Bard gibi sohbet robotları daha güçlü dil becerilerine sahip ve anında e-posta, şiir ve dönem ödevi yazabiliyor ve önlerine atılan hemen hemen her konuda atıp tutabiliyorlar.

OpenAI esasen iki iletişim yöntemini birleştirmiş durumda. Şirket, konuşmayı sohbet robotuyla etkileşime girmenin daha doğal bir yolu olarak görüyor. ChatGPT'nin sentetik seslerinin (erkek ve kadın sesleri de dahil olmak üzere beş farklı seçenek arasından seçim yapılabiliyor) popüler dijital asistanlarda kullanılan diğer seslerden daha ikna edici olduğunu savunuyor.

ChatPlus aboneleri kullanabilecek

Şirket, önümüzdeki iki hafta içinde chatbot'un yeni versiyonunun aylık 20 dolarlık bir hizmet olan ChatGPT Plus'a abone olan herkese sunulmaya başlayacağını söyledi. Ancak bot yalnızca iPhone, iPad ve Android cihazlarda kullanıldığında sesli yanıt verebiliyor.

Hatasını düzeltebiliyor

Botun sentetik sesleri piyasadaki diğer birçok sesten daha doğal, ancak yine de kulağa biraz 'robotik' gelebiliyor. Diğer dijital asistanlar gibi, eşsesli kelimelerle mücadele edebiliyor. The New York Times yeni ChatGPT'ye "gym" kelimesinin nasıl heceleneceğini sorduğunda, bot şöyle dedi: "J-I-M." Ancak ChatGPT gibi bir sohbet robotunun avantajlarından biri de kendini düzeltebilmesi. "Hayır, bir tür spor salonu" denildiğinde bot şöyle cevap verdi: "Ah, şimdi neden bahsettiğinizi anlıyorum. İnsanların egzersiz ve spor yaptığı yer G-Y-M diye yazılıyor"

ChatGPT'nin sesli arayüzü daha önceki asistanları anımsatsa da, temelde yatan teknoloji farklı. ChatGPT, öncelikle internetten toplanan büyük miktarda metni analiz ederek anında dil üretmeyi öğrenen büyük bir dil modeli veya LLM tarafından yönlendiriliyor.

Bir sesli asistandan çok daha fazlası

Alexa ve Siri gibi eski dijital asistanlar, belirli sayıda görevi yerine getirebiliyor veya "Alexa, ışıkları aç" veya "İstanbul'da hava durumu nedir?" gibi veritabanlarına programlanmış sınırlı sayıda soruya yanıt verebiliyor. Eski asistanlara yeni komutlar eklemek haftalar alabiliyor. ChatGPT, her zaman doğru olmasa da, kendisine yöneltilen hemen her soruya saniyeler içinde kapsamlı bir şekilde yanıt verebiliyor.

OpenAI ChatGPT'yi Alexa ya da Siri gibi bir araca dönüştürürken, Amazon ve Apple gibi şirketler de dijital asistanlarını ChatGPT türevi bir teknolojiye dönüştürüyor.

Apple ve Amazon da boş durmuyor

Geçtiğimiz hafta Amazon, Alexa için "herhangi bir konu" hakkında daha akıcı konuşmayı amaçlayan güncellenmiş bir sistemin önizlemesini yaptı. Şirket, kısmen yeni bir LLM tarafından yönlendirildiğini ve daha doğal görünmesini sağlamak için hız ve tonlamaya yönelik başka yükseltmelere sahip olduğunu söyledi.

ChatGPT ile nasıl rekabet edeceğine dair planlarını kamuoyuyla paylaşmayan Apple, proje hakkında bilgi sahibi iki kişiye göre, gelecekteki ürünler için geniş dil modelinin bir prototipini test ediyor.

Görme engelliler için de bir fırsat

Web üzerinden ve iPhone, iPad ve Android cihazlarda kullanıldığında yeni ChatGPT görüntülere de yanıt verebiliyor. Bir fotoğraf, grafik veya diyagram verildiğinde, görüntünün ayrıntılı bir açıklamasını sağlayabiliyor ve içeriği hakkındaki soruları yanıtlayabiliyor. Bu, görme engelli kişiler için de faydalı bir araç olabilir.

Madalyonun diğer yüzü

OpenAI görüntü aracını ilk olarak ilkbahar aylarında sergiledi, ancak araştırmacılar teknolojinin nasıl kötüye kullanılabileceğini daha iyi anlayana kadar kamuoyu ile paylaşılmayacağını söyledi. Diğer endişelerin yanı sıra, aracın fotoğraflardaki kişileri hızlı bir şekilde tanımlamak için kullanılan fiili bir yüz tanıma hizmeti haline gelebileceğinden de endişe ediliyor.

Microsoft, OpenAI'nin teknolojisine dayanan bu tür bir görsel arama aracını yaz boyunca Bing sohbet robotunda tanıttı.

Güvenlik ve politika üzerine yoğunlaşan OpenAI araştırmacısı Sandhini Agarwal, botun yeni versiyonunun artık yüzleri tanımlama çabalarını reddedeceğini söyledi. Ancak diğer fotoğrafların son derece ayrıntılı açıklamalarını sağlamak üzere tasarlandı. Örneğin Hubble Uzay Teleskobu'ndan bir görüntü verildiğinde, fotoğraftaki içeriği detaylandıran paragraflarla yanıt verebiliyor.

Bot aynı zamanda öğrenciler için de bir araç olabilir. Kelimeler, sayılar ve diyagramlar içeren bir lise matematik probleminin görüntüsü verildiğinde, bot problemi anında okuyup çözebiliyor. Öğrenmek ya da kopya çekmek için etkili bir yol olabilir.

© 2023 The New York Times Company