Hala "halüsinasyon görüyor": OpenAI'ın yeni modeli GPT5 beklentileri karşılamadı

OpenAI, geçtiğimiz hafta büyük beklentilerle yeni yapay zekâ modeli GPT-5’i kullanıma sundu. Şirketin CEO’su Sam Altman, GPT-5’in bugüne kadar geliştirdikleri “en güçlü, en hızlı ve en güvenilir” model olduğunu açıklarken, yapay zekâ sistemlerinde sıkça görülen ve halüsinasyon adı verilen bilgi uydurma sorununun da bu modelde en aza indirileceğini söylemişti.

Ancak ABD merkezli Axios'un merceğine aldığı ilk kullanıcı deneyimleri ve bağımsız testler, bu iddiaların şimdilik beklendiği kadar güçlü karşılık bulmadığını gösteriyor.

Altman, GPT-5'in ücretsiz kullanıcılar için bile "doktora seviyesinde zekâ" sunacağını belirtse de, ilk günlerde yaşanan teknik aksaklıklar modelin performansını gölgede bıraktı. ChatGPT kullanıcıları, özellikle modelin temel matematik ve coğrafya sorularında yaptığı hataları sosyal medyada paylaşarak tepki gösterdi.

CEO, sorunun temelinde, kullanıcı sorgularının yanlışlıkla daha zayıf yanıt üreten alt modellere yönlendirilmesi olduğunu açıkladı. Bu sorun nedeniyle, modelin daha yüksek hesaplama gücü kullanan “akıl yürütme” versiyonu devreye giremedi. Şirket, bu aksaklığın giderildiğini ve model yönlendirmesinin iyileştirileceğini duyurdu.

Halüsinasyon testinde skorlar nasıl?

Yapay zekâ yanıtlarında doğruluk oranını değerlendiren Vectara adlı platform, GPT-5’in “halüsinasyon” performansını GPT-4 ve diğer modellerle karşılaştırdı. Sonuçlar şöyle:

GPT-4: %1,8 halüsinasyon oranı
GPT-5: %1,4 halüsinasyon oranı
GPT-4o: %1,31 halüsinasyon oranı
o3-mini (High Reasoning): %0,795 ile en düşük oran

Yani, GPT-5 her ne kadar GPT-4’ten daha iyi performans sergilese de, fark oldukça sınırlı. Üstelik OpenAI’nin kendi daha küçük boyutlu ancak yüksek akıl yürütme yetenekli modeli olan o3-mini High Reasoning, tüm modeller arasında en az hata yapan model oldu.

Algı ve gerçeklik arasında makas açılıyor

Uzun süredir yapay zekânın “ölçek büyüdükçe zeka da büyür” ilkesine dayanan gelişim çizgisi, bu lansmanla birlikte sorgulanmaya başlandı. Eleştirmenler, GPT-5’in beklenenden az sıçrama yapmasını, bu stratejinin sınırlarına işaret olarak görüyor. Örneğin yapay zekâ eleştirmeni ve The Guardian yazarı Gary Marcus, “Sadece modeli büyütmekle AGI’ye (yapay genel zeka) ulaşılacağına hâlâ inanan kaldıysa, bu gelişmeden sonra bir kez daha düşünmeli” yorumunu yaptı.

OpenAI ne yapacak?

OpenAI, yaşanan aksaklıkları gidermek için:

Eski modelleri (örneğin GPT-4o) tekrar erişime açtı.
Akıl yürütme moduna daha fazla kullanıcı erişimi sağladı.
Hangi modelin kullanıldığını gösteren bir ChatGPT arayüz güncellemesi planlıyor.
“Model yönlendirme sistemi”ni (autoswitcher) yeniden yapılandırıyor.
Altman ayrıca, bazı kullanıcıların yapay zekâ modellerine duygusal bağ geliştirdiği yönündeki raporları ciddiyetle incelediklerini ve bu durumun zihinsel sağlığı tehlikeye atmaması için çalışmalar yürüttüklerini ifade etti.

Kaynak: Gazete Oksijen

Hala "halüsinasyon görüyor": OpenAI'ın yeni modeli GPT5 beklentileri karşılamadı

Halüsinasyon testinde skorlar nasıl?

Algı ve gerçeklik arasında makas açılıyor

OpenAI ne yapacak?

Yazarlar

Biletini armağan edebileceğiniz 10 tiyatro oyunu

Kadının sessiz direnişi

Faiz indirim sürecinde borsada hangi sektörlere daha yakından bakmalı?

Pazar rekorlara doyamadı

“Ekonomide solcu kültürde sağcı”

Çok Okunanlar

Yılın en iyi kurgu ve kurgu dışı kitapları

Mert Hakan Yandaş, Metehan Baltacı ve Zorbay Küçük dahil: Çok sayıda futbolcu, hakem ve yönetici gözaltında

89 yıldır üretim yapıyordu: Köklü zeytinyağı markası konkordato ilan etti

Kripto varlık platformu Paribu'dan 240 milyon dolarlık satın alma

Axios: Türkiye asker göndermeye hazır, Trump'ın Gazze'deki savaşı bitirecek planın son aşaması

Bizi Takip Edin