Meta duyurdu: Metni okuyup müzik yapabilen yapay zeka geliştirildi
Meta, kullanıcıların metin komutlarına dayalı olarak müzik ve ses oluşturmalarına yardımcı olacak AudioCraft adlı açık kaynaklı yapay zeka aracını tanıttı. Kullanıcılar hazırladıkları metinleri taratarak yapay zekaya müzik yaptırabilecek
Meta, metinden yüksek kaliteli, gerçekçi ses ve müzik ürettiğini iddia ettiği yeni bir yapay zeka araçları seti olan AudioCraft'ı piyasaya sürdü. Meta, AudioCraft ile ilgili bir blog yazısında "Profesyonel bir müzisyenin bir enstrümanda tek bir nota çalmak zorunda kalmadan yeni besteler keşfedebildiğini hayal edin" şeklinde yeni aracını ifade ediyor ve şu sözleri kaydediyor: "Ya da bir araç sayesinde küçük bir işletme sahibinin Instagram'daki son video reklamına kolaylıkla bir film müziği eklediğini düşünün"
AudioCraft üç modelden oluşuyor: MusicGen (müzik için), AudioGen (ses efektleri için) ve EnCodec (üretken bir yapay zeka kod çözücü). Teknoloji devine göre MusicGen, Meta'nın sahip olduğu ya da bu amaç için özel olarak lisanslanmış 20 bin saatlik müziğe karşılık gelen metin açıklaması ve meta verilerle birlikte yaklaşık 400 bin kayıt üzerinde eğitildi. Şirket, "Müzik parçaları çevresel seslerden daha karmaşıktır ve uzun vadeli yapıda tutarlı örnekler üretmek özellikle yeni müzik parçaları oluştururken önemlidir" sözlerini kaydetti.
Meta, MusicGen tarafından üretilen müziğin neye benzediğini gösteren bir klip de paylaştı. '80'lerin elektronik davul ritimleri, caz enstrümantal, orta tempo ve yumuşak hip-hop gibi farklı türler bu katologda yer alıyor.
Müzisyenler çok uzun zamandır elektronik sesle deneyler yapıyor. Ancak bilgisayar tarafından üretilen müzikler genellikle mevcut seslerden manipüle edilmiş seslerden oluşuyor. AudioCraft ve yapay zeka tarafından üretilen diğer müzikler bu sesleri sadece metinlerden ve geniş bir ses verisi kütüphanesinden oluşturabiliyor.
Bu arada Meta, AudioGen'in "genel ses efektleri" üzerine eğitildiğini ve köpek havlaması, araba kornası veya ahşap zemindeki ayak sesleri gibi çevresel sesler ve ses efektleri üretebildiğini söyledi. Şirket ayrıca EnCodec kod çözücünün "yüksek kaliteli müzik üretimine olanak tanıyan" geliştirilmiş bir versiyonunu da piyasaya sürdü.
AudioCraft modellerini açık kaynak kodu olarak yayınlayan şirket, amacın "araştırmacılara ve uygulayıcılara kendi modellerini ilk kez kendi veri kümeleriyle eğitebilmeleri için erişim sağlamak ve yapay zeka tarafından üretilen ses ve müzik alanını ilerletmeye yardımcı olmak" olduğunu açıkladı.
Meta, AudioCraft modellerini eğitmek için kullanılan veri kümelerinin çeşitlilikten yoksun olduğunu, özellikle de kullanılan müzik veri kümesinin "Batı tarzı müziğin daha büyük bir bölümünü içerdiğini" ve İngilizce yazılmış metin ve meta veriler içeren ses-metin çiftleriyle sınırlı olduğunu kabul etti.
Şirket, açıklamasında "AudioCraft'ın kodunu paylaşarak, diğer araştırmacıların üretici modellerdeki olası önyargıları ve bunların kötüye kullanımını sınırlamak veya ortadan kaldırmak için yeni yaklaşımları daha kolay test edebileceklerini umuyoruz" dedi.
Telif hakkı sorunu çıkabilir
Sanatçılar ve sektör uzmanları, makine öğrenimi yazılımı ile internetten toplanan verilerden kalıpları tanıyarak ve çoğaltarak çalıştığı için telif hakkı ihlalleri konusunda endişelerini dile getirdiler.
Meta, müzik ve yapay zekayı bir araya getirmeye çalışan en son şirket. Google, metin komutlarına dayalı olarak dakikalarca ses üreten ve yalnızca araştırmacıların erişebildiği büyük bir dil modeli olan MusicLM ile ortaya çıktı. Ardından, Drake ve The Weeknd'in ses benzerliklerini içeren "yapay zeka tarafından oluşturulmuş" bir şarkı, kaldırılmadan önce viral oldu.
Daha yakın zamanda, Grimes gibi bazı müzisyenler, insanları seslerini yapay zeka yapımı şarkılarda kullanmaya teşvik etti.