ABD’li tekno-devlerin harcadığının onda biriyle geliştirdiği yapay zeka asistanı Nasdaq’ta deprem yaratan Çinli girişim DeepSeek’in öyküsünü Oksijen yazarları kaleme aldı...
“Seyrelterek” verimi artırıyor
Patronu Wenfeng’in kelimeleriyle ana odağı “verimlilik”. Sadece 6 milyon dolara mal olan DeepSeek’in ilk modeli, 2 bin 48 adet Nvidia H800 çipi üzerinde çalıştırıldı. En büyük avantajı, algoritmasının “seyreltme” tekniği saye sinde çok daha az parametreyle çalışabilmesi.
M. Serdar Kuzuloğlu'nun yazısı
Zekice bir mühendislik stratejisi
DeepSeek’te iki aşamalı eğitim yapılıyor. İlk model deneme yanılma yöntemiyle kendi kendine eğitiliyor. İlk modelin doğruladığı kaliteli veriler, ikinci modeli eğitmekte kullanılıyor. Bu yüzden matematik ve kodlama gibi “doğruluğu” ölçülebilen konularda çok başarılı.
Ayşegül İldeniz'in yazısı
Erişilebilir yapay zeka için teşekkürler!
Çinli DeepSeek’in aniden hayatımıza girip teknoloji devlerinin tahtını tehdit etmesi ABD’de ‘Sputnik etkisi’ olarak tanımlandı. Rusların uzaya ilk çıktığı yıllara yetişemedim ama bu DeepSeek olayı bana İstanbul’daki eski Polonya pazarlarını hatırlattı. 90’larda çeşitli semtlere kurulan tezgahlarda o zamanın sağlam teknolojik ürünlerini uygun fiyata alabiliyorduk
Levent Ertem'in Yazısı