Yapay zeka uygulamaları artık herkesin cebinde… Yapay zekanın tavsiyeleri, önerileri ve yorumları, birçok kişi için çok kritik bir hal aldı. Herhangi bir şeyin doğru olup olmadığını dahi “yapay zekaya sorarak” teyit ediyoruz. Eh, hal böyle olunca ve yapay zekanın sözlerine duyduğumuz ihtiyacın giderek artmasıyla, eğer hastalık şüphemiz varsa onu bile yapay zekaya sorar duruma geldik. Peki, yapay zeka tanı koymada ne derece başarılı?
Uluslararası saygın tıp dergisi The Lancet’ta yayımlanan bir çalışma bu sorunun cevabını vermek amacıyla hazırlandı. 20 farklı üniversite ve kurumdan 30 bilim insanının imzası olan çalışmada Türkçenin de aralarında olduğu 10 farklı dil araştırmanın merkezinde. Literatürden alınan 4 bin 917 nadir hastalık vakasına ilişkin şikayetlere karşı yapay zeka modellerinin ne ölçüde doğru tanı koyduğu, hem dil hem de yapay zeka modeli bazında incelendi. Çünkü nadir hastalıklardan muzdarip insanların yüzde 25’ine 5-30 yıl boyunca teşhis konulmuyor. İlk teşhislerin yüzde 40’ı da yanlış oluyor. En az 10 bin farklı nadir hastalık türü var. Yüzde 25-50 ihtimalle sonuç veren genom dizilimi metodu kesin teşhise erişmekten hala uzak.
Araştırmacılar da bu konuda yapay zekadan nasıl ve ne ölçüde yararlanabileceğimizin cevabını arıyor.
Diller arasında büyük fark yok
Bulgular, 360 farklı hastalıkla karşılaşan GPT-4o modelinin kullanılan dile göre değişmekle yüzde 16’yla yüzde 20.5 arası bir oranla ilk yanıtta doğru teşhis koyabildiğini gösteriyor. GPT-4o’nun doğru tanıyı ilk üç sırada belirtme ihtimali ise yüzde 25.4 ile yüzde 28.6 arasında değişiyor. Çalışma kapsamında incelenen diller; Almanca, Çekçe, Çince, Felemenkçe, Fransızca, İngilizce, İspanyolca, İtalyanca, Japonca ve Türkçe. İngilizce ve diğer dillerde yazılan prompt’lara cevaben doğru teşhis oranında pek de büyük bir fark yok.
Yapay zeka nadir hastalıkları 5’te 1 oranla biliyor
GPT-4o kullanıldığı zaman, Türkçe yazılmış metinlerde ilk yanıtta doğru teşhise erişme oranı yüzde 19.8. İngilizcede de bu oran aynı. Oransal olarak ilk yanıtta doğru tanıyı koyma konusunda en yüksek yüzdeye Felemenkçe yazılmış vakalar sahip.
Felemenkçe vakaların yüzde 20.5’inde yapay zeka hastalık tespitini ilk seferde yaptı. En düşük seviyede Japonca yazılan nadir hastalık vakaları var. Japonca metinler için ilk yanıtta teşhis oranı ise yüzde 16.
Vakalardaki gerçek hastalığın ilk üç yanıttan birinde tespit edilme oranları ise şöyle: İngilizce (%27), İspanyolca (%27.5), Çekçe (%25.2), Türkçe (%27.9), İtalyanca (%26.7), Çince (%27.2), Felemenkçe (%27.6), Japonca (%25.3), Fransızca (%27.2). Teşhis konulamadığı durumlarda ise ilk sırada 247 vakayla Japonca yazılanlar var. Onu 108 vaka ile Türkçe takip ediyor, üçüncü ise 101 vaka ile Almanca yazılmış olanlar.
| DİL | İLK YANIT | ÜÇ YANITTAN BİRİ | 10 YANITTAN BİRİ | TANI YOK |
| İngilizce | 978 | 1328 | 1532 | 1 |
| İspanyolca | 941 | 1355 | 1560 | 0 |
| Çekçe | 880 | 1240 | 1396 | 26 |
| Türkçe | 978 | 1373 | 1544 | 108 |
| Almanca | 938 | 1290 | 1439 | 101 |
| İtalyanca | 851 | 1314 | 1498 | 3 |
| Çince | 909 | 1338 | 1401 | 6 |
| Felemenkçe | 1006 | 1357 | 1503 | 23 |
| Japonca | 790 | 1245 | 1352 | 247 |
| Fransızca | 918 | 1338 | 1524 | 5 |
