人工智慧研究實驗室「OpenAI」最近展示了一款新的生成模型「Jukebox」,它能製作新的音樂,儘管成品聽起來像一些熟悉曲目的變異版,但在技術上仍然令人驚艷。據OpenAI的發文指出,研究者選擇音樂是因為其複雜性,即使成果很難稱得上真正的音樂,但依然令人印象深刻:它們有可辨識的和絃、旋律和歌詞。
OpenAI的做法很吸睛,他們採用原始音訊訓練模型,而不是採用「象徵性的音樂」,因為象徵性的音樂沒有包括人聲。為了得到好的成果,研究者使用卷積神經網路(convolutional neural networks)對原始音訊進行編碼與壓縮,然後使用轉換器產生新的壓縮音訊,最後採樣將其轉換回原始音訊。
他們的做法類似於OpenAI先前開發的音樂創作人工智慧「MuseNet」,但「Jukebox」走得更遠一點,它與研究者合作(該公司稱「共同創作」)產生了自己的歌詞。這跟採用MIDI數據的MuseNet不同,Jukebox的模型在120萬首歌曲(其中有60萬首英文歌)的原始數據庫裡訓練而成,並使用LyricWiki的數據庫(包括音樂家和音樂類型)和歌詞來改善模型的輸出結果。
不過研究者也表明,這款新的模型仍然具有局限性,他們寫道:「雖然Jukebox在音樂品質、連貫性、音訊樣本的長度,以及對音樂家、音樂類型和歌詞的調整能力方面都向前邁進,但與人類所創作的音樂仍存在巨大的差距。例如,人工智慧產生的歌曲雖然展現了地方音樂的連貫性,遵循傳統的和絃模式,甚至生成出色的獨唱,但我們並沒有聽到更廣闊的音樂架構,例如重複的合聲。」
這個實驗還有其他問題,就是Jukebox可能引發版權爭議。OpenAI的研究者認為使用版權物進行機器訓練為「合理使用」,並希望美國專利和商標局為此出面說明釐清。但是,假如用人工智慧製作出一張新專輯,歌曲的版權又該歸誰呢?這也是法律未來必須規範的新問題。
Jukebox合成的歌曲: