20 Nisan 2024, Cumartesi
Haber Giriş: 01.04.2024 18:37 | Son Güncelleme: 01.04.2024 18:47

OpenAI sınırları zorluyor: 15 saniyelik kayıttan ses klonlayabilen teknoloji geliştirdi

Yapay zeka sohbet robotu ChatGPT'nin geliştiricisi OpenAI, "Voice Engine" adını verdiği yeni teknolojisinin yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak orijinal konuşmacıya çok benzeyen doğal bir konuşma üretebildiğini duyurdu
OpenAI sınırları zorluyor: 15 saniyelik kayıttan ses klonlayabilen teknoloji geliştirdi

OpenAI tarafından, şirketin ses klonlayabilen yeni teknolojisine ilişkin açıklama yapıldı. Açıklamada, "Voice Engine"in yalnızca yazılı metin ve 15 saniyelik tek bir ses örneği kullanarak konuşmacının sesine çok benzeyen bir konuşma üretebildiği bilgisi paylaşıldı.

Söz konusu teknolojinin 2022'de geliştirildiği belirtilen açıklamada, "kötüye kullanım potansiyeli" nedeniyle daha geniş bir sürüm için temkinli ve bilinçli yaklaşım benimsendiği ifade edildi.

"İnsanların seslerine benzeyen konuşmalar üretmenin özellikle de seçim yılında ciddi riskler taşıdığının farkındayız" denilen açıklamada, bu kapsamda ABD'nin de dahil olduğu çok sayıda uluslararası ortakla birlikte çalışılarak geri bildirim toplandığı belirtildi.

Güvenlik endişelerine ilişkin, Voice Engine'in test aşamasındaki kullanıcı partnerlerine, kişi veya kuruluşların kimliğini kullanmanın yasaklandığı, orijinal konuşmacının rızasının gerektiği ve seslerin yapay zeka tarafından üretildiğinin izleyicilere açıkça bildirilmesinin zorunlu kılındığı açıklandı.

Çeviri de yapabilecek

Açıklamada ayrıca, Voice Engine'in orijinal konuşmacının sesini koruyarak çeviri yapabileceği de kaydedildi. Video ve podcast gibi içerik üreticilerinin bu özellikten faydalanarak "kendi sesleriyle" dünyaya ulaşabileceği, çevrilen seste orijinal konuşmacının "aksanını" da koruyabileceği bilgisi paylaşıldı.

Kaynak: AA