Sadece bir günde ABD tarihinin en büyük değer erimesine yol açarak çip üreticisi Nvidia’nın 500 milyar dolardan fazla değer kaybetmesine yol açan Çin menşeli yapay zekâ girişimi DeepSeek’in hikâyesi de ilgi çekici.
OpenAI’ın en yetkin ürününün performansını 1/30 API maliyetiyle gerçekleştirerek teknoloji devrimi yapan şirket bunu 6 milyon dolarla başardı.
Bu noktada API’yi açalım. Application Programming Interface, yani Uygulama Programlama Arayüzü olarak dilimize çevirebileceğimiz kavram, herhangi bir yazılımın, başka bir yazılımda tanımlanmış işlevlerini kullanabilmesini anlatıyor.
Meta, Google ve Microsoft’un döktüğü milyar dolarlara karşılık bu hafta sundukları ucuz maliyetli DeepSeek-R1 sayesinde tüm dünyada yoğun ilgi gördüler.
Halihazırda Apple Store ve Android Store’da en çok indirilen uygulamaların başında olan bu yapay zekâ uygulamasına akın edenler DeepSeek’in zekâsını artırmasına da yardımcı oluyor.
Şirketin kurucusu ve CEO’su Liang Wenfeng, merak edilen bir portre. Kendisini detaylı şekilde anlattığımız haberimize bu bağlantıyı tıklayarak ulaşabilirsiniz.
Temmuz 2024’te şirketin açık kaynaklı V2 modelinin popüler hale gelmesinden kısa süre önce Wenfeng ile yapılan röportaj, hem şirketin bunu nasıl başardığını hem de gelecek planlarını özetliyor.
Ulusal bir sempozyumda An Yong adlı kişinin sorularını yanıtlayan Wenfeng’in söyledikleri çarpıcı:
An Yong: DeepSeek V2 yayınlandıktan sonra, büyük model endüstrisinde fiyat savaşı tetiklendi. Piyasada bozguncu olarak görülüyorsunuz.
Liang Wenfeng: Asla bozguncu olmayı planlamadık. Bu kazara oldu.
Bu sonuç sizi şaşırttı mı?
Çok şaşırdım. Fiyatlandırmanın bu kadar hassas bir konu olacağını beklemiyorduk. Kendi hızımızla ilerliyor, maliyetleri hesaplıyor ve buna göre fiyatlandırma yapıyorduk. Prensibimiz ne zararına satmak ne de aşırı kâr elde etmek. Mevcut fiyatlandırma, maliyetlerimizin üzerinde mütevazı bir kâr marjı sağlıyor.
Sizin ürününüzü duyurmanızdan beş gün sonra Zhipu AI de aynı şekilde fiyat düşürdü ve ardından ByteDance, Alibaba, Baidu ve Tencent de yarışa katıldı.
Zhipu AI, giriş seviyesi bir ürün için fiyat düşürdü, ancak amiral gemisi modelleri hâlâ pahalı. ByteDance, amiral gemisi modeliyle bizim fiyatımızı eşleyen ilk şirket oldu. Bu da diğerlerini takip etmeye zorladı. Büyük şirketlerin model maliyetleri bizden çok daha yüksek olduğundan, kimsenin zararına çalışacağını hayal bile etmemiştik. Sonunda, bu durum da internet çağının sübvansiyon mantığını yansıttı.
Dışarıdan bakıldığında fiyat indirimleri, internet çağı rekabetinin tipik bir özelliği olarak kullanıcıları kapma taktiği gibi görünüyor.
Kullanıcıları kapmak birincil hedefimiz değildi. Fiyatları indirmemizin nedeni, birincisi, bir sonraki nesil model yapılarını keşfederken maliyetlerimizin düşmesi; ikincisi, AI ve API hizmetlerinin herkes için uygun fiyatlı ve erişilebilir olması gerektiğine inanmamız.
Hedefimiz hızlı kâr değil, sınırları ilerleterek ekosistemi büyütmek
Çoğu Çinli firma hem modeller hem de uygulamalar üzerinde çalışıyor. Neden DeepSeek sadece araştırmaya odaklanıyor?
Çünkü şu an en önemli olan şey, küresel yeniliğe katılmak. Yıllardır Çinli şirketler, başka yerlerde geliştirilen teknolojik yenilikleri kullanarak uygulamalar üzerinden para kazanmaya alışmış. Ama bu sürdürülebilir değil. Bu seferki hedefimiz hızlı kâr değil, teknolojik sınırları ilerleterek ekosistem büyümesini sağlamak.
İnternet ve mobil internet çağlarından kalma yaygın inanç, ABD'nin yenilikte lider olduğu, Çin'in ise uygulamalarda öne çıktığıdır.
Ekonomik gelişmeyle birlikte Çin'in, başkalarının sırtından gitmekten ziyade, bir faydalanıcıdan bir katkıda bulunana dönüşmesi gerektiğine inanıyoruz. IT devriminin son 30 yılında, bizler çekirdek teknoloji yeniliklerine pek katılmadık.
Moore Yasası'nın gökten düşmesine alıştık (Oksijen notu: Moore Yasası: Her 18 ayda bir tümleşik devre üzerine yerleştirilebilecek bileşen sayısının iki katına çıkacağı, bunun bilgisayarların işlem kapasitelerinde büyük artışlar yaratacağı, üretim maliyetlerinin aynı kalacağı, hatta düşme eğilimi göstereceğini öngören ampirik gözlem). Ölçek Yasası da benzer şekilde ele alınıyor. Ancak bu gelişmeler, Batı liderliğindeki teknoloji topluluklarının nesiller boyu bitmek bilmez çabalarının sonucu. Bu sürece aktif olarak katılmadığımız için öneminin farkında değiliz.
Neden DeepSeek V2, Silikon Vadisi'ni şaşırttı?
ABD'de günlük yenilikler arasında bu oldukça sıradan. Şaşkınlıkları, bir Çinli şirketin, takipçi değil yenilikçi olarak onların oyununa katılmasından kaynaklanıyor. Ki bu durum çoğu Çinli firmanın alışkın olduğu bir şey.
Ancak Çin bağlamında, saf yeniliğe öncelik vermek neredeyse bir lüks gibi görünüyor. Büyük modeller geliştirmek sermaye yoğun bir iş. Her şirket ticari olmadan önce sadece araştırmaya odaklanamaz.
Yenilik kesinlikle maliyetli, geçmişte mevcut teknolojileri benimseme eğilimimiz, Çin'in daha önceki gelişim aşamasıyla bağlantılıydı. Ama bugün, Çin'in ekonomik ölçeği ve ByteDance, Tencent gibi devlerin kârı küresel anlamda önemli. Eksik olan, sermaye değil, güven ve yüksek kalibreli yetenekleri etkin yenilik için organize etme yeteneği.
Neden Çinli şirketler, hatta iyi fonlanmış devler, genellikle hızlı ticarileştirmeyi önceliklendirir?
Otuz yıldır kârı yeniliğe tercih ettik. Yenilik sadece iş odaklı değil, merak ve yaratıcı hırs gerektirir. Eski alışkanlıklarla bağlıyız, ama bu bir aşama.
Ama DeepSeek bir işletme, kâr amacı gütmeyen bir araştırma laboratuvarı değil. Yenilik yapar ve atılımlarınızı açık kaynak yaparsanız - örneğin Mayıs'ta piyasaya sürülecek MLA mimarisi yeniliği - rakipler bunları hızlıca kopyalamaz mı? Sizin hendek nerede?
Yıkıcı teknolojide, kapalı kaynağın yarattığı açık geçicidir. Hatta OpenAI'nin kapalı kaynak modeli bile diğerlerinin yetişmesini engelleyemez.
Dolayısıyla, gerçek açık ekibimizin büyümesinde - bilgi birikimi, yenilikçi bir kültür oluşturmakta. Açık kaynak yapmak ve makaleler yayınlamak önemli kayıplara yol açmaz. Teknologlar için takip edilmek ödüllendiricidir. Açık kaynak kültüreldir, sadece ticari değil. Katkıda bulunmak bir onurdur ve yetenekleri kendisine çeker.
NVIDIA’nın hâkimiyetinin sebebi
AI'da saf teknik liderlik yeterli değil. DeepSeek'in bahse girdiği daha büyük hedef nedir?
Çin'in AI'sının sonsuza dek takipçi olarak kalamayacağına inanıyoruz. Çoğu zaman, Çin ve Amerikan AI arasında bir veya iki yıllık bir açık olduğunu söyleriz, ama gerçek fark orijinallik ve taklit arasında. Bu değişmezse, Çin her zaman takipçi olacak. Bazı keşifler kaçınılmaz.
NVIDIA'nın hakimiyeti sadece çabalarının sonucu değil - Batı teknoloji ekosistemlerinin bir sonraki nesil teknoloji yol haritalarında işbirliği yapmasının sonucu. Çin'in benzer ekosistemlere ihtiyacı var. Pek çok yerli çip, destekleyici teknoloji topluluklarının eksikliği ve ikinci el bilgilere dayanarak başarısız oluyor. Birileri sınırı zorlamalı.
DeepSeek şu anda OpenAI'nin erken günlerini hatırlatan idealist bir hava yayıyor ve açık kaynaklısınız. Gelecekte OpenAI ve Mistral'ın yaptığı gibi kapalı kaynaklı bir modele geçmeyi planlıyor musunuz?
Kapalı kaynağa geçmeyeceğiz. Sağlam bir teknoloji ekosistemi oluşturmak daha önemli olduğuna inanıyoruz.
Fon toplama planları var mı? Medya raporları Huanfang'ın DeepSeek'i halka arz için ayırmayı planladığını söylüyor. Silikon Vadisi AI startup'ları kaçınılmaz olarak büyük oyuncularla hizalanır. Siz de öyle misiniz?
Kısa vadede plan yok. Sorunumuz hiçbir zaman para olmadı. Sorunumuz yüksek kalite çipler üzerindeki ambargoydu.
Müşteriler neden DeepSeek'in API'sini büyük oyuncularınkine tercih etsin?
Gelecekteki dünya muhtemelen uzmanlaşmış iş bölümü dünyası olacak. Temel AI modelleri sürekli yenilik gerektirir ve büyük şirketlerin sınırları var - bu rol için her zaman en iyi seçenek olmayabilirler.
Ama teknoloji tek başına önemli bir rekabet farkı yaratabilir mi? 'Gizli' şeyler olmadığını söylediniz.
Gizli şeyler yok, ama kopyalama zaman ve maliyet gerektirir. NVIDIA GPU'larında gizli bir sihir yok - ancak yetişmek için ekipleri yeniden kurmak ve bir sonraki nesil teknolojilerini takip etmek gerekir. Gerçek açık burada.
Rekabete geldiğinizde temel felsefeniz nedir?
Bir şeyin toplumsal verimliliği artırıp artırmadığına ve endüstri değer zincirinde gücümüzü bulup bulamayacağımıza odaklanıyorum. Nihai hedef verimliliği artırıyorsa, geçerli.
Yenilik büyük ölçüde bir şans meselesi mi? Ofis yerleşiminiz, her iki taraftan da kolayca açılabilen kapılara sahip toplantı odalarını içeriyor. Meslektaşlarınız, bu tasarımın ‘tesadüf’ için izin verdiğini, Transformer hik^syesini hatırlattığını -yani bir yoldan geçenin tartışmayı duyup evrensel bir çerçeveye dönüştürmesini- söylüyor.
Yenilik öncelikle bir inanç meselesidir. Neden Silikon Vadisi bu kadar yenilikçi? Çünkü denemeye cesaret ediyorlar. ChatGPT çıktığında, Çin'de ön cephe araştırmasına inanç yoktu. Yatırımcılardan büyük teknoloji firmalarına kadar pek çok kişi, aradaki farkın çok büyük olduğunu düşünüp uygulamalara odaklandı. Ama yenilik güven gerektirir ve gençlerin daha fazlası var.
Diğer AI şirketlerinin aksine, fon ve medya ilgisi arayan diğer AI şirketlerinin aksine, DeepSeek oldukça sessiz kalıyor. DeepSeek'in AI'da çalışmak isteyenler için ilk tercih olmasını nasıl sağlıyorsunuz?
Çünkü en zor sorunları çözüyoruz. En üst düzey yetenekler için en çekici şey, dünyanın en zorlu zorluklarını çözme fırsatı. Aslında, Çin'deki en üst düzey yetenekler genellikle küçümsenir çünkü hardcore yenilik nadirdir, bu yüzden tanınmazlar. Biz onların arzuladığı şeyi sunuyoruz.
Büyük AI modellerinin sonucunun ne olacağını nasıl görüyorsunuz?
Temel modeller ve hizmetler sunan uzmanlaşmış şirketler olacak, uzmanlaşmış iş bölümünden uzun bir değer zinciri oluşacak. Bu temeller üzerine toplumun çeşitli ihtiyaçlarını karşılamak için daha fazla oyuncu ortaya çıkacak.
Şu anda enerjinizin çoğunu nereye odaklıyorsunuz?
Ana odak noktam, büyük modellerin bir sonraki neslini araştırmak. Hala çözülmemiş pek çok zorluk var.
Wall Street Journal yazarının kitabına yazdığı önsöz: Fiyatları modellemek için bir yol olmalı
Liang Wenfeng hakkında ilginç bir yazı da The Wall Street Journal’da yer alıyor. Gregory Zuckermann, 2019'da, Renaissance Technologies'i kuran ve onlarca yıldır inanılmaz derecede yüksek yıllık getirilere (yaklaşık yüzde 66) sahip olan hedge fonunun öncüsü Jim Simons hakkında yazdığı kitaptan bahsederken, son günlerde kendisi, Jim Simons ve DeepSeek’in adının geçtiği paylaşımları sık sık görmeye başlayınca dikkat kesilip yazılanlara bir bakmış.
Bunun son dönemde kripto paralar hakkında yazılar yazdığı için altcoin olduğunu düşünen Zuckerman, Amazon’da söz konusu kitabın satışının da arttığını fark edince daha da meraklanmış.
En sonunda dün bir arkadaşından mail almış ve “Bugün ABD teknoloji hisse senetlerini düşüren yeni Çin yapımı AI modeli hakkında yazılanları okudum. Bu modeli geliştiren Çinli şirketin başkanı Liang Wenfeng, aynı zamanda bir Çinli ‘quant’ hedge fonu işletiyor. İlginç olan, senin Simons kitabının Çince baskısına önsöz yazmış olması."
Daha sonra Zuckerman, Liang’ın yazdığı önsözü okumuş. Şu ifadeleri aktarıyor: “İş yerinde zorluklarla karşılaştığımda, Simons'un sözlerini hatırlarım: 'Fiyatları modellemek için bir yol olmalı.' Bu kitabın yayınlanması, daha önce çözülmemiş pek çok gizemi çözüyor ve bize öğrenmemiz için zengin deneyimler sunuyor."
Zuckerman, Liang’ın bu çıkarımından çok etkilenmiş ve ona ulaşmaya çalışmış ama nafile. Sonunda Wall Street Journal’daki haberine şu notu eklemiş: “Wenfeng, bunu okuyorsan, bana bir mesaj gönder. Bana bir telefon et. Bana bir e-posta at. Çin'de olduğunu biliyorum. Bekliyor olacağım.”