25 Şubat 2025, Salı Gazete Oksijen
Haber Giriş: 31.01.2025 04:46 | Son Güncelleme: 31.01.2025 10:45

DeepSeek mucizesini anlama rehberi

DeepSeek mucizesini anlama rehberi
A+ Yazı Boyutunu Büyüt A- Yazı Boyutunu Küçült

ABD’li tekno-devlerin harcadığının onda biriyle geliştirdiği yapay zeka asistanı Nasdaq’ta deprem yaratan Çinli girişim DeepSeek’in öyküsünü Oksijen yazarları kaleme aldı...

“Seyrelterek” verimi artırıyor

Patronu Wenfeng’in kelimeleriyle ana odağı “verimlilik”. Sadece 6 milyon dolara mal olan DeepSeek’in ilk modeli, 2 bin 48 adet Nvidia H800 çipi üzerinde çalıştırıldı. En büyük avantajı, algoritmasının “seyreltme” tekniği saye sinde çok daha az parametreyle çalışabilmesi.

M. Serdar Kuzuloğlu'nun yazısı

Zekice bir mühendislik stratejisi

DeepSeek’te iki aşamalı eğitim yapılıyor. İlk model deneme yanılma yöntemiyle kendi kendine eğitiliyor. İlk modelin doğruladığı kaliteli veriler, ikinci modeli eğitmekte kullanılıyor. Bu yüzden matematik ve kodlama gibi “doğruluğu” ölçülebilen konularda çok başarılı.

Ayşegül İldeniz'in yazısı

Erişilebilir yapay zeka için teşekkürler!

Çinli DeepSeek’in aniden hayatımıza girip teknoloji devlerinin tahtını tehdit etmesi ABD’de ‘Sputnik etkisi’ olarak tanımlandı. Rusların uzaya ilk çıktığı yıllara yetişemedim ama bu DeepSeek olayı bana İstanbul’daki eski Polonya pazarlarını hatırlattı. 90’larda çeşitli semtlere kurulan tezgahlarda o zamanın sağlam teknolojik ürünlerini uygun fiyata alabiliyorduk

 Levent Ertem'in Yazısı