音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲

音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲

英國皇家愛樂協會曾於 1817 年委託貝多芬創作兩部交響曲,其中一部即為在古典樂界中具有重要地位的《第 9 號交響曲》,但隨著貝多芬病逝,僅存殘稿的《第 10 號交響曲》也從此胎死腹中。

近幾年隨著人工智慧的發展,奧地利卡拉揚研究所延請多位音樂家、研究者與 AI 技術專家的協助,蒐集整理貝多芬的作品與創作軌跡,並透過 AI 的學習訓練,竟譜寫出可能是最接近貝多芬風格的《第 10 號交響曲》,可見 AI 的潛力真的是深不可測。

雖然我們一般人未必有能力在自己的系統上,部署這些相關的 AI 訓練模型,不過網路上已經有許多 AI 音樂生成服務出現,並正處於蓬勃發展的態勢。

文章目錄

AI 生成音樂是什麼?

所謂的 AI 音樂,就如同與我們之前所提過的 AI 繪圖、AI 生成影片等,是一種基於演算法而產生的旋律或歌曲,其背後是透過大量資料數據的學習與分析。近期著名的 AI 孫燕姿事件,則是網友透過蒐集特定歌手的聲音素材,結合 AI 語音模型進行訓練後,用以替換掉原歌手的聲音,偏向於語音的 Deepfake。相形之下,AI 生成音樂則更為複雜,這牽涉到 AI 該如何去理解樂理、分析曲式、和弦等音樂的主要元素,解構之後再重新進行組合。

AI 音樂與產業的結合

話雖如此,AI 的運用在音樂界其實並不罕見,如 Sony CSL(Computer Science Laboratories)團隊很早就推出研究專案 Flow Machines,它是一款透過機器學習和音樂分析技術所開發出的 AI 作曲工具,用以輔助創作者進行音樂的製作。此外 Sony CSL 還釋出一首有著披頭四風格的單曲〈Daddy’s Car〉,就是透過 Flow Machines 生成所有旋律,再由真正的音樂人進行編排與作詞,成品讓眾人為之驚艷。透過這種方式,創作者確實能夠大幅減少音樂製作的時間,從而可以專注於其他更需要創意的層面。而龐大的學習資料,則讓 AI 可以輕易融合各種風格類型的音樂,包含流行樂、搖滾、爵士以及古典交響樂等等,並根據特定情境或需求來生成,像是影片或遊戲的 BGM,可以說是目前 AI 音樂最廣泛的用途之一。

版權爭議相對較高

不過另一方面,AI 音樂的侷限性也是顯而易見的,例如現階段的 AI,還無法像人類一樣,真正從無到有做出一首曲子,仍需要有人去進行參數的微調及整合,即使如此,我們也很難透過 Prompt 對音符的排列組合做出精確控制,因為文字和音樂,本就屬於兩種截然不同的表達形式。而 AI 音樂的商用限制也比 AI 繪圖嚴格,畢竟僅是畫風相似的話,很難被直接判定為侵權,但如果用了版權音樂作為訓練資料,確實可能會生成出旋律雷同的作品,不過這並不妨礙各家科技公司,前仆後繼地推出 AI 生成音樂工具及服務。由於音樂創作在過去很長的一段時間內,均被視為是人類所獨有,是人類創造力思維的一種展現,因此 AI 音樂勢必對現行的音樂生產體系造成影響,某些人可能會因此受惠,有些工作則會就此消逝,但 A I確實提供了人們探索及創作音樂的新方式。

透過 AI 技術重現的貝多芬第 10 號交響曲, 可以在 Apple Music、Spotify 等音樂平台上聽得到。

台灣歌手陳珊妮今年發表新單曲,上架之後無人發現是透過 AI 所演唱。

Google 相當積極地與跨領域的音樂家、研究者合作,探索 AI 生成音樂模型 MusicLM 的可能性。

科技巨頭跨入 AI 音樂領域

除了 Sony 本身旗下就有音樂相關事業之外,像 Google 以及 Facebook 的母公司 Meta,也在近幾年相繼投入 AI 軍備競賽,因此 AI 生成音樂作為 AIGC 的其中一環,當然也成為武力展示的重點,不過有趣的是,Google 和 Meta,對於 AI 音樂的態度稍有不同。

Google MusicLM 有條件公測

Google 於今年一月時,首次發表了名為 MusicLM 的實驗性 AI 模型,建立在同屬 Google 的 AI 生成聲音模型 AudioLM 的基礎上,但演算法更為強大,能夠透過文本描述生成高音質的音樂,其特色除了可以利用自然語言來生成音樂,也能透過口哨或哼歌等方式來生成新的音樂,甚至還可以搭配圖片來作為生成的線索。根據 Google 公開的論文內容,MusicLM 使用了 28 萬小時以上的音樂資料進行訓練,因此能創作出複雜度更高的旋律,而不是單純的幾個循環節拍。就 Google 所釋出的幾段音樂,一般人其實很難分辨得出究竟真人創作還是 AI 生成;此外,研究人員也在實驗中發現,MusicLM 有時會直接複製一段訓練資料當中的旋律,這些倫理以及版權上的風險,都使 Google 對於 MusicLM 更為謹慎,原本 Google 僅打算停留在技術展示層面,直到 6 月初的 Google I/O 上,才決定有限度的對外開放,必須先線上填單,收到邀請https://parg.co/UC7z才能進行測試。

Meta 開源 MusicGen

Google I/O 結束不到半個月,Meta 也突然發佈了自己的 AI 音樂生成模型MusicGen,跟 Google 較勁的意味相當濃厚。MusicGen 是基於 Google 提出的 Transformer 神經網路模型,採用「非監督式學習」的機器學習技術,不需要人為針對訓練資料進行標記,這點與 Google 的 MusicLM 不同,因此 Meta 僅使用了 2 萬小時的音樂資料進行訓練,其中包含來自來自 ShutterStock 與 Pond5 的授權音樂。此外,Meta 也很大方地透過 GitHub 開源 MusicGen 的函式庫 Audiocraft,讓開發者能夠在自己的系統上部署 MusicGen。對一般用戶來說,則可透過 Hugging Face 線上平台試用 MusicGen,支援透過文本敘述或上傳音樂片段,來生成約 12 秒的音樂內容。根據 Meta 說明,透過 MusicGen 所生成的 AI 音樂,是完全可以作為商業用途的。

Google MusicLM 目前仍需申請才能試用。網址:https://parg.co/UC7z。

透過 Hugging Face 平台即可試用 MusicGen。網址:https://parg.co/UC7T

Google 的 MusicLM,除了能夠透過文本描述生成音樂外,還能以圖片作為生成的線索。

OpenAI MuseNet:基於深度學習的 AI技術展示

 音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲網址:https://openai.com/research/musenet

催生出 ChatGPT 的 OpenAI,早在 2019 年時就已經推出 AI 音樂模型MuseNet,根據 OpenAI 的說明,MuseNet 使用了數十萬個 MIDI 格式的音樂檔案進行機器學習,藉由與 GPT-2 相同的非監督學習方式訓練,讓 AI 學習和聲、節奏和曲調等組合模式。但 MuseNet 並非像 Google 或 Meta 是透過文本描述來生成音樂,而是經由指定音樂家、音樂類型與參考歌曲的方式來產生音樂,使用者還可以選擇要使用何種樂器演奏,例如鋼琴、鼓、貝斯等等,透過網頁工具即可生成。不過根據網友的回饋,MuseNet 雖然是免費提供大眾使用,但經常會因為更新或維護的關係,而暫時關閉進階作曲選項,其主要用途比較偏向於展示 OpenAI 的 AI 研究成果。

特色 1網頁介面

網頁介面MuseNet 的網頁介面,除了介紹其功能與使用的技術,也提供生成工具可免費使用。

特色 2音樂風格

音樂風格 並非以文本描述生成音樂,而是透過選單指定音樂風格,進階模式下還可選擇演奏的樂器。

特色 3音檔下載

音檔下載依據設定的條件,MuseNet 會生成 4 首音樂讓使用者選擇,並提供 MP3、WAV 等格式下載。

特色 4 Jukebox

JukeboxJukebox 為進化版的 MuzeNet,目前已開源,處理資料更龐大,1 分鐘歌曲需運算 9 小時。

soundful:利用豐富範本直接生成新音樂

音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲網址:https://soundful.com/

介面相當精美的 soundful 是一個基於 AI 的音樂製作平台,允許使用者快速的創作出錄音室等級的音樂作品,在 soundful 網站上提供了豐富的音樂種類及範本,依據用戶的情境及需求,透過 AI 的輔助,僅花數秒鐘就可以產出適合的音樂,除了提供 MP3 及 WAV 檔案外,也可以支援生成 STEM 包,方便專業音樂人進行後期的混音微調。Soundful 的音樂均為免版稅音樂,版權屬於 soundful,除免費用戶的音樂僅供個人使用外,訂閱者不但可以使用更多範本,音樂亦可免費用於商業用途,不過若想要販售透過 soundful 所生成的音樂,例如上架到 Spotify,則需另外向 soundful 購買音樂版權,版權費用每首音樂 50 美元起,購買之後便可獲得該樂曲的所有權。

特色 1 範本種類

特色 2 AI 音樂彙整

特色 3 音樂生成

特色 4 檔案格式

檔案格式免費用戶每月可以下載 10 首音樂及 1 個 STEM 包,不過僅供個人使用。

Soundraw:以情緒作為音樂生成線索

音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲網址:https://soundraw.io/

Soundraw 是由 2020 年創立於東京澀谷的 SOUNDRAW 公司,所推出的 AI 作曲工具,最長可以生成 5 分鐘的原創音樂,它的音樂生成方式與 soundful 類似,但可調整的參數更多,基本上是藉由選擇音樂類型及風格的標籤,來決定音樂生成的方向,比較特別的是 Soundraw 還提供了「情緒」的標籤選項,例如恐懼、快樂、幸福等等,讓使用者能夠更精準的把握音樂要傳達的感覺。雖然僅有訂閱用戶能夠下載音樂,但音樂生成器是可以免費使用的。此外,音樂版權屬於 Soundraw,若想要用來販售營利,雖不用另外付費,但要注意需自行添加 60% 新的聲音元素,使其聽起來與原本不同,且編輯後的音樂版權仍屬於 Soundraw。

特色 1 音樂的基調

音樂的基調依照需要可以指定音樂生成長度,最長 5 分鐘,也可選擇節奏快慢以及音樂的情緒。

特色 2 標籤分類

標籤分類透過選取想要的音樂類型、風格標籤,系統會即時生成出符合的音樂,一次可產出 15 首。

特色 3 演奏強弱

演奏強弱點開音樂之後,可以添加或刪除其中的段落,並可設定該段落的演奏力道強弱。

特色 4 專業模式

專業模式開啟專業模式則有更多可供調整的參數,可以設定個別樂器的強弱、音樂的拍速等等。

AIVA:首個獲音樂機構認證的 AI 作曲家

 

音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲網址:https://aiva.ai/

近幾年每逢 NVIDIA GTC 開發者大會,總會以〈I am AI〉作為開場音樂,這首曲子其實就是出自 AIVA 之手,AVIA 除了是來自盧森堡的新創公司,同時也是第一個經過法國音樂作曲家協會(SACEM)所認證的虛擬作曲家,於2016年發表首張音樂專輯《Genesis》。另一方面,AVIA 也釋出了 AI 音樂工具 Music Engine,能夠讓使用者依照需求客製化音樂,AVIA 提供了多種音樂生成方式,一種是從網站上既有的音樂進行重新運算;其次是提供較為詳細的參數設置與混音選項,生成之後甚至可以按照每個音符進行微調;AIVA 也支援上傳音樂檔案作為參考資料,讓 AIVA 據以生成音樂。免費用戶每月可以下載 3 首音樂,除了版權為 AIVA 所有,還需註明出處。

特色 1 參數設置

參數設置相較於其他 AI 音樂生成器,AIVA 的參數項目相當豐富,還可疊加新的音軌進行混音。

特色 2 音檔上傳

音檔上傳可上傳 MIDI、MP3 或 WAV 等音訊檔,讓 AIVA 進行生成,上傳的音樂長度至少需 1 分鐘以上。

特色 3 音樂編輯器

音樂編輯器對於進階的使用者,可以透過編輯器工具,對已成生的音樂進行細部的修整微調。

特色 4 成就系統

成就系統使用 AIVA 進行創作即可獲得成就,當等級提升後還可獲得獎勵。

Boomy:AI 做音樂,收益分給你

音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲網址:https://boomy.com/

於 2021 年才上線的 Boomy,可以說是 AI 音樂的新創公司。今年 5 月初Spotity 大動作移除了自家串流音樂平台上,由 Boomy 所生成的音樂,其數量高達了數萬首,根據 Boomy 統計,Boomy 的使用者迄今已經創作了多達一千五百多萬首歌曲,約佔全球錄製音樂總量的 14.91%,這個數據除了顯示出 Boomy 的用戶數量有多龐大之外,也側面證明透過 Boomy 製作音樂有多麼簡單快速。此外,雖然音樂版權均歸於 Boomy,但 Boomy 很聰明地建立起一套收益制度,成為 Boomy 得以快速發展的基礎。創作者可以透過在 Boomy 上架音樂來獲取版稅分成,即使是免費用戶也可以分成,不過僅限 3 首歌,想要上架更多音樂,或把音樂用於其他商業用途,則需訂閱進階會員。

特色 1 音樂生成

音樂生成 生成音樂的手續相當簡單,只需從預設的音樂類型與風格當中點選即可。

特色 2 參數設定

參數設定可供調整的項目並不多,主要是安排音樂的段落、進行刪除或複製。

特色 3 人聲演唱

人聲演唱可在音樂中加入人聲,使其更像一首完整的歌曲,支援即時錄音或上傳 WAV 檔。

特色 4 專輯發佈

專輯發佈完成的多首音樂可以合併為專輯,當 Boomy 審核通過之後,便會代為上架到音樂平台。

本文同步刊載於PC home雜誌

音樂版的ChatGPT一鍵搞定!這5款 AI 音樂生成器讓你神速成為作曲家、甚至幫貝多芬續寫第10號交響曲

歡迎加入PC home雜誌粉絲團

小治
作者

《PC Home 電腦家庭》雜誌及 T 客邦網站編輯。負責遊戲類型新聞及評析、軟體應用教學及企劃撰寫、電腦相關周邊硬體測試,以及打雜…

使用 Facebook 留言
發表回應
謹慎發言,尊重彼此。按此展開留言規則