Reuters'ın haberine göre, Silikon Vadisi'nin güçlü ancak pahalı yapay zeka modelleri, geleceğe hazırlık yapmak isteyen şirketler için bugüne kadar bir zorunluluk olarak görülüyordu. Ancak artık giderek daha fazla teknoloji CEO'su, yapay zekanın daha geniş ölçekte benimsenebilmesi için daha ucuz seçeneklerin kritik öneme sahip olacağını savunuyor.
Microsoft CEO'su Satya Nadella, Palo Alto Networks CEO'su Nikesh Arora ve Coinbase CEO'su Brian Armstrong gibi üst düzey yöneticiler, daha küçük ve daha düşük maliyetli modellerin kurumsal ihtiyaçların önemli bir bölümünü karşılayabileceğini söylüyor.
Bu yaklaşım, yakın zamana kadar yapay zeka araçlarının yoğun kullanımını teşvik eden şirketlerin bakış açısını yeniden değerlendirmesinin sonucu olarak görülüyor. O dönemde artan kullanım, verimliliğin bir göstergesi kabul ediliyordu. Ancak artık bu kullanımın faturası şirketleri zorlamaya başladı.
Yapay zeka kullanımını ölçen birim olan token fiyatları düşüyor olsa da, yapay zeka şirketlerinin sabit abonelik modelinden kullanım bazlı fiyatlandırmaya geçmesi nedeniyle belirli bir görevi tamamlamanın maliyeti artıyor. Bu durum, görev başına kullanım miktarının önceden tahmin edilmesini zorlaştırırken şirketlerin karşısına öngörülemeyen ve çoğu zaman daha yüksek faturalar çıkarıyor.
Örneğin Uber, çalışanlarının yapay zeka destekli yazılım geliştirme araçlarını hızla benimsemesi nedeniyle 2026 yılı için ayırdığı yapay zeka bütçesini yalnızca dört ay içinde tüketti. Bunun ardından yönetim, kullanıma sınırlama getirmek zorunda kaldı.
Şirketlerin yapay zeka sistemlerini güvenli şekilde çalıştırmasına yardımcı olan girişim BlueRock'un CEO'su Harold Byun, "Lisanslama modelindeki değişiklik birçok kişiyi hazırlıksız yakaladı. Hemen ardından müşterilerimizden bütçelerin yüzde 20 ila yüzde 30 oranında aşıldığına ilişkin çok sayıda geri bildirim almaya başladık." dedi.
Şirketler dev yapay zekâ faturalarından endişe ediyor
Şirketlerin yapay zekâ kullanımının artmasıyla birlikte maliyetler ilk tahminlerin çok üzerine çıkıyor. Bunun nedeni, artık görevlerin daha fazla adım, daha fazla veri ve daha uzun istemler (prompt) gerektirmesi.
Gartner, yapay zeka destekli yazılım geliştirme maliyetlerinin 2028 yılına kadar ortalama bir yazılım geliştiricisinin maaşını aşacağını öngörüyor. Araştırma şirketinin yaptığı ankete göre yöneticilerin dörtte üçü bu yıl teknoloji bütçelerinin artacağını düşünüyor. Katılımcıların yaklaşık yarısı ise çift haneli bütçe artışı bekliyor.
Bu gelişmeler şirketleri daha ucuz modellere yönlendirirken, aynı zamanda OpenRouter gibi yönlendirme platformlarının kullanımını artırıyor. Şirketler, görevleri en uygun maliyetli modele dağıtırken yalnızca yazılım geliştirme gibi karmaşık işlemlerde premium modelleri kullanmayı tercih ediyor.
Citi'nin yayımladığı nota göre OpenRouter üzerinde işlenen açık kaynaklı token'ların payı ocak ayında yüzde 34 seviyesindeyken haziran ayında yüzde 65'e yükseldi.
DeepSeek'in önü daha fazla açılacak
Bu eğilimin, güvenlik endişeleri nedeniyle büyük şirketlerde beklenen ölçüde yaygınlaşamayan ancak girişimler arasında güçlü şekilde benimsenen Çin merkezli DeepSeek gibi açık kaynaklı model geliştiricilerine avantaj sağlaması bekleniyor.
Palo Alto Networks CEO'su Nikesh Arora geçen hafta X platformunda yaptığı paylaşımda, "Kurumsal müşterileri kazanmak istiyorsanız token'ları gelecekte oluşacak düşük fiyatlar üzerinden bugünden fiyatlandırmalısınız" ifadelerini kullanarak yapay zeka laboratuvarlarına çağrıda bulundu.
OpenAI'nin de bu değişime uyum sağlamaya çalıştığı görülüyor. ChatGPT'nin geliştiricisinin, rakibi Anthropic'in benzer adımlar atmasını beklediği ve buna hazırlık olarak token kullanım ücretleri de dahil olmak üzere önemli fiyat indirimlerini değerlendirdiği bildiriliyor.
Ancak daha ucuz modellere geçiş, özellikle halka arz hazırlıkları yapan yapay zeka şirketlerinin gelir büyümesini olumsuz etkileyebilir.
Synovus Securities'te özel varlık yönetimi finansal danışmanı Christopher Brown, "OpenAI ile Anthropic arasında borsaya ilk açılan şirket olabilmek için fiyat savaşına dayalı yoğun bir rekabet yaşanacak" değerlendirmesinde bulundu.
Yatırımcıların yapay zeka yatırımlarının geri dönüşüne ilişkin beklentilerini yeniden gözden geçirmesi, SpaceX'in halka arz sonrası zayıf performansı ve OpenAI'nin halka arzını erteleyebileceğine yönelik haberlerin etkisiyle teknoloji hisseleri geçen haftanın büyük bölümünde satış baskısı altında kaldı.
Açık kaynaklı ve Çinli modeller öne çıkıyor
Artan maliyetler, şirketleri açık kaynaklı modellere ve daha ucuz Çinli alternatiflere yönlendiriyor. OpenRouter üzerindeki en popüler dört modelin tamamı Çin kaynaklı olurken, listenin ilk sırasında DeepSeek yer alıyor.
Citi'nin verilerine göre Çinli modeller, ABD'nin en gelişmiş yapay zeka modelleriyle aralarındaki performans farkını hızla kapatırken, milyon token başına yalnızca 18 sent ücret talep ediyor. Buna karşılık en gelişmiş modellerde ortalama maliyet milyon token başına yaklaşık 4 dolar seviyesinde bulunuyor.
BlueRock CEO'su Harold Byun, "Eskiden açık kaynaklı modeller lider yapay zeka modellerinin bir yıldan daha fazla gerisindeydi. Bugün ise tahminler aradaki farkın yaklaşık dört aya indiğini gösteriyor. Bu farkın kapanmaya devam edeceğini düşünüyoruz" dedi.
Bununla birlikte bazı analistler, özellikle siber güvenlik gibi hassas sektörlerde Çinli modellerle ilgili güvenlik endişelerinin kurumsal kullanımı sınırlayabileceğini belirtiyor.
Analistler, şirketlerin bunun yerine bulut bilişimde olduğu gibi en uygun performans ve fiyatı bulabilmek amacıyla birden fazla yapay zeka sağlayıcısıyla çalışma stratejisini benimsemesini bekliyor.
Şirketlerin yapay zeka modellerini daha hızlı ve daha düşük maliyetle çalıştırmasına yardımcı olan WEKA'nın Yapay Zeka Direktörü Val Bercovici ise açık kaynaklı modellerin artık "yüzde 10 maliyetle, yüzde 90 seviyesinde performans" sunduğunu belirterek, "Her iş için pahalı tokenlar kullanmamıza gerek yok" dedi.
