Yapay Zeka İle Müzik
Üretmek:
1--Açık kaynaklı yapay zeka
uygulamaları geliştiren San Francisco menşeli araştırma laboratuvarı OpenAI,
Mayıs ayı başında yaptığı açıklama ile kendi kendine melodi yazabilen, hatta bu
melodilere söz uydurup popüler sanatçıların tarzında seslendiren Jukebox adlı
bir sistemi duyurdu.
1.1--Jukebox henüz mükemmel
değil; fakat son derece etkileyici sonuçlara imza atıyor. Örneğin Rolling
Stones tarzı gitar odaklı şarkıların inanılmaz bir benzerlikte taklitlerini
üretebiliyor, Ella Fitzgerald gibi şarkı söylüyor, Elton John veya Rod Steward
gibi sanatçıların vokal tarzlarını taklit ediyor
1.2--Bir teknoloji kanalı, bu
çabaları “sarhoş bir insanın karaoke çabalarına” benzetiyor. Yine de bunların
yapay zeka destekli müzik üretiminde önemli ve işlevsel bir adım olduğunu
söylemek yanlış olmaz.
2--OpenAI, bilgisayarlara
şarkı yazdırmak için 1,2 milyon şarkıdan oluşan dev bir veritabanı oluşturdu.
Yapılan açıklamada bu modellerin rock, hip-hop, pop ve jazz gibi farklı müzik
tarzlarında şarkı üretebileceğini gösterdi. Bahsedilen modeller birçok
enstrüman ve stilde melodi, ritim, hatta uzun kompozisyonlar
ve tınılar
yakalayabiliyorlar; ayrıca bu müziklerle birlikte şarkıcıların ses ve
stillerini de üretebiliyorlar.
3--Müzik üretiminde
bilgisayar programları on yılı aşkın bir süredir kullanılıyor. Örneğin PG Music
firmasının Band in A Box yazılımı, kullanıcının girdiği akorları kullanarak
farklı tarzlarda melodiler ve çok partisyonlu armoniler üretebiliyor.
4--2018 yılında Google, yapay
sinir ağları kullanarak çalışan Musical Transformer uygulaması ile akılda kalıcı
şarkılar üretmeyi başarmıştı.
5--Geçtiğimiz yıl OpenAI
tarafından geliştirilen MuseNet de yine orijinal melodiler yazabiliyordu; ancak
bu şarkıların sözleri eksikti.
5.1--Şirketin Jukebox adlı
yazılımı, dünyada söz, müzik ve vokali bir arada üretebilen ilk program oldu.
Programın ardındaki teknik özellikler OpenAI web sitesinde mevcut. Geliştirmede
en büyük zorluğun, büyük miktarda müzik verisini işlenmesi olduğu belirtiliyor.
5.2--CD kalitesinde (44kHz, 16bit)
4 dakikalık bir şarkıda 10 milyonun üzerinde timestamp (zaman damgası)
bulunuyor. Verileri sıkıştırmak, atık verileri süzme ve upsampling (kalite
iyileştirme) gibi işlemler için otomatik bir kodlama yordamı var. Bu sıkıştırma
algoritmasıyla bile, 1 dakikalık ses dosyasını oluşturmak yaklaşık 9 sâat
sürüyor.
5.3--Program geliştirilmeye
devam ediyor. OpenAI, mevcut sınırlandırmaların farkında: “Jukebox müzikal
kalite, tutarlılık, örnek uzunluğu ve sanatçı, tür, şarkı sözleri gibi
özellikleri açısından büyük bir adım olsa da insan tarafından üretilmiş müzikle
arasında hala büyük bir uçurum var”. Mesela Jukebox henüz koro ve nakarat gibi
uzun müzikal temalar yazamıyor.