Yapay zeka sohbet robotu ChatGPT'nin geliştiricisi OpenAI, ses, görüntü ve metin üzerinden gerçek zamanlı mantık yürütebilen yeni modeli GPT-4o'yu tanıttı. OpenAI'dan yapılan açıklamada, GPT-4o'nun daha doğal insan-bilgisayar etkileşimine doğru atılmış bir adım olduğu belirtilerek, modelin herhangi bir metin, ses ve görüntü kombinasyonundan oluşan girdilerden çıktı ürettiği aktarıldı.
Modelin ses girişlerine verdiği yanıt süresinin, herhangi bir konuşmadaki insan tepki süresine benzer olduğuna işaret edilen açıklamada, GPT-4o'nun, mevcut modellerle karşılaştırıldığında özellikle görüntü ve ses anlama konusunda daha iyi olduğu vurgulandı. GPT-4o ile metin, görüntü ve ses genelinde uçtan uca tek bir yeni modelin eğitildiğinin bilgisi verilerek, yeni modelin, tüm girdi ve çıktıların aynı sinir ağı tarafından işlendiği ilk model olduğu ifade edildi.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
— OpenAI (@OpenAI) May 13, 2024
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
Ayrıca hem ücretsiz hem de ücretli kullanıcılar için, bilgisayarda yapılan işlemlere entegre olacak şekilde tasarlanmış, Mac işletim sistemi için yeni bir ChatGPT masaüstü uygulamasının da kullanıma sunulduğu bildirildi. Öte yandan OpenAI'nın bugün düzenlediği tanıtım etkinliğinde, modelin önceki modellere göre daha uygun maliyetli olması nedeniyle ücretsiz olarak da sunulacağı, ücretli GPT-4o kullanıcılarının ise daha fazla kapasiteye sahip olacağı kaydedildi. Yeni modelin birkaç hafta içinde ChatGPT'de sunulacağı belirtildi.
Kaynak: AA