05 Aralık 2025, Cuma
Haber Giriş: 12.08.2025 15:55 | Son Güncelleme: 12.08.2025 16:11

Hala "halüsinasyon görüyor": OpenAI'ın yeni modeli GPT5 beklentileri karşılamadı

OpenAI'nin büyük umutlarla tanıttığı GPT-5, beklentilerin altında kaldı. İlk kullanıcılar modelin basit hatalar yaptığını bildirirken, halüsinasyon testlerinde de fark yaratamadı. Bağımsız ölçümlere göre GPT-5, doğrulukta GPT-4’ü ancak küçük bir farkla geride bırakabildi
Hala "halüsinasyon görüyor": OpenAI'ın yeni modeli GPT5 beklentileri karşılamadı
A+ Yazı Boyutunu Büyüt A- Yazı Boyutunu Küçült

OpenAI, geçtiğimiz hafta büyük beklentilerle yeni yapay zekâ modeli GPT-5’i kullanıma sundu. Şirketin CEO’su Sam Altman, GPT-5’in bugüne kadar geliştirdikleri “en güçlü, en hızlı ve en güvenilir” model olduğunu açıklarken, yapay zekâ sistemlerinde sıkça görülen ve halüsinasyon adı verilen bilgi uydurma sorununun da bu modelde en aza indirileceğini söylemişti. 

Ancak ABD merkezli Axios'un merceğine aldığı ilk kullanıcı deneyimleri ve bağımsız testler, bu iddiaların şimdilik beklendiği kadar güçlü karşılık bulmadığını gösteriyor.

Altman, GPT-5'in ücretsiz kullanıcılar için bile "doktora seviyesinde zekâ" sunacağını belirtse de, ilk günlerde yaşanan teknik aksaklıklar modelin performansını gölgede bıraktı. ChatGPT kullanıcıları, özellikle modelin temel matematik ve coğrafya sorularında yaptığı hataları sosyal medyada paylaşarak tepki gösterdi.

CEO, sorunun temelinde, kullanıcı sorgularının yanlışlıkla daha zayıf yanıt üreten alt modellere yönlendirilmesi olduğunu açıkladı. Bu sorun nedeniyle, modelin daha yüksek hesaplama gücü kullanan “akıl yürütme” versiyonu devreye giremedi. Şirket, bu aksaklığın giderildiğini ve model yönlendirmesinin iyileştirileceğini duyurdu.

Halüsinasyon testinde skorlar nasıl?

Yapay zekâ yanıtlarında doğruluk oranını değerlendiren Vectara adlı platform, GPT-5’in “halüsinasyon” performansını GPT-4 ve diğer modellerle karşılaştırdı. Sonuçlar şöyle:

  • GPT-4: %1,8 halüsinasyon oranı
  • GPT-5: %1,4 halüsinasyon oranı
  • GPT-4o: %1,31 halüsinasyon oranı
  • o3-mini (High Reasoning): %0,795 ile en düşük oran

Yani, GPT-5 her ne kadar GPT-4’ten daha iyi performans sergilese de, fark oldukça sınırlı. Üstelik OpenAI’nin kendi daha küçük boyutlu ancak yüksek akıl yürütme yetenekli modeli olan o3-mini High Reasoning, tüm modeller arasında en az hata yapan model oldu.

Algı ve gerçeklik arasında makas açılıyor

Uzun süredir yapay zekânın “ölçek büyüdükçe zeka da büyür” ilkesine dayanan gelişim çizgisi, bu lansmanla birlikte sorgulanmaya başlandı. Eleştirmenler, GPT-5’in beklenenden az sıçrama yapmasını, bu stratejinin sınırlarına işaret olarak görüyor. Örneğin yapay zekâ eleştirmeni ve The Guardian yazarı Gary Marcus, “Sadece modeli büyütmekle AGI’ye (yapay genel zeka) ulaşılacağına hâlâ inanan kaldıysa, bu gelişmeden sonra bir kez daha düşünmeli” yorumunu yaptı.

OpenAI ne yapacak?

OpenAI, yaşanan aksaklıkları gidermek için:

  • Eski modelleri (örneğin GPT-4o) tekrar erişime açtı.
  • Akıl yürütme moduna daha fazla kullanıcı erişimi sağladı.
  • Hangi modelin kullanıldığını gösteren bir ChatGPT arayüz güncellemesi planlıyor.
  • “Model yönlendirme sistemi”ni (autoswitcher) yeniden yapılandırıyor.
  • Altman ayrıca, bazı kullanıcıların yapay zekâ modellerine duygusal bağ geliştirdiği yönündeki raporları ciddiyetle incelediklerini ve bu durumun zihinsel sağlığı tehlikeye atmaması için çalışmalar yürüttüklerini ifade etti.
Kaynak: Gazete Oksijen