Riffusion的聯合創始人兼首席執行官Seth Forsgren-訪談系列

Riffusion的聯合創始人兼首席執行官Seth Forsgren領導了AI動力的音樂生成工具的開發,該工具從文本提示中創建音軌。 Riffusion允許用戶實時嘗試不同的音樂風格和聲音,從而使音樂創作更容易訪問。該平台專為創造力和易用性而設計,使任何人都可以探索AI生成的音樂而無需正式的音樂專業知識。

Riffusion是我親自嘗試過的最好的AI音樂生成器,並且是我建議對AI生成的音樂感興趣的用戶推薦的工具。

您可以帶我們回到復興的早期嗎?最初的火花導致您構建AI音樂生成工具?

復興始於兩位終身音樂家之間的一個業餘愛好項目。我和我的聯合創始人海克(Hayk)和我一直在業餘樂隊一起演奏了十多年,我們一直對《創意行為》(Creative Act)著迷。一個下午,我們在我的後院寫一首歌,在尋找靈感時,我們開始使用早期的AI模型,這些模型可以從無到有地產生圖像。但是,我們真正想要的是一種可以與我們一起製作音樂的工具,我們可以與我們合作的AI來想到沒有人聽過的新旋律和聲音。當時沒有什麼比這比其他任何人都多。

您什麼時候意識到它有可能成為一家成熟的公司?

當我們與幾個朋友分享我們的愛好項目時,轉折點是出現的,而無處不在。不僅僅是感興趣的技術人員或AI愛好者 – 專業音樂家,製作人和數百萬的日常音樂愛好者都以我們從未想到的方式參與其中。我們世界上一些我們最喜歡的藝術家開始使用他們使用Riffusion創建的樣本!

該項目還激發了Google,Bytedance和其他人在我們的工作中啟動自己的AI音樂工作的啟發,很明顯,這不僅是一個實驗 – 這是更大的事情的基礎。作為一家公司,我們現在有機會將這種新工具帶給各地的創意人士。

從實驗轉變為商業產品時,您面臨的最大技術和業務挑戰是什麼?

在技​​術方面,我們走了很長一段路。我們的第一批模型產生了顆粒狀的,五秒鐘的低忠誠音樂片段,現在我們可以產生具有出色的可控性和表現力的全長高質量歌曲。這在模型架構中取得了重大進步,並不斷從頭開始重新思考事物。這是我們團隊中出色的研究人員的榮譽,我們已經走了這麼遠,我們知道這仍然是技術的可能開始。

在業務方面,我們不得不深入思考音樂行業中的複興。 AI音樂仍然是新的,儘管我們看到了業餘創作者和專業人士的令人難以置信的收養,但仍在進行有關AI和人類創造力如何共存的持續對話。我們的重點一直是增強音樂家的能力,而不是替代他們 – 為人們提供新的工具,以從未想到的方式探索他們的創造力。

即將重點的重點是產生簡短的音樂即興演奏,但現在可以構成全長作品。哪些進步使您可以擴展其功能?

通過從頭開始訓練我們自己的基礎模型,我們能夠提高Riffusion輸出的質量,表現力和可控性。我們最新模型Fuzz的開發和發布帶來了一個重大突破。在盲目測試中,Fuzz在給出相同的歌詞和聲音提示時始終優於競爭模型,並且該模型的設計獨特旨在幫助用戶找到個人聲音- 用戶使用RIFFUSION花費的時間越多,絨毛就越絨毛了解他們的個人口味,並且生成的音樂越個性化。我們認為這是複興的巨大差異。

許多AI音樂模型在保持音樂中的情感深度方面掙扎。即興風情如何捕捉不同的情緒和样式的細微差別?

音樂具有深刻的個人和情感,我們希望復興能夠產生在人類層面上產生共鳴的音樂。正如我們的顧問亞歷克斯·帕爾(Alex Pall)所說:“這不是發出聲音。這是關於讓人們通過聲音感到特別的感覺。”

就像製作精良的小提琴可以使藝術家充分錶達自己的能力一樣,我們也會訓練模型,成為由用戶的創造力指導的樂器。無論您是輸入旋律,文本提示,甚至圖像,即可適應您的意圖,都可以塑造輸出以反映不同的情緒,動態和風格的選擇。我們專注於日復一日回來的用戶在平台上製作出非常棒的音樂。

隨著AI生成的音樂的不斷發展,您如何看待它的補充而不是取代人類的創造力?

AI是音樂家的樂器,而不是替代者。在整個歷史上,從合成器到數字音頻工作站的新音樂工具 – 擴大了藝術家在不減少人類藝術性的情況下可以創造的東西。復興遵循同樣的哲學。我們將Riffusion視為一種鼓勵音樂家進行實驗,合作和嘗試新形式講故事的樂器。藝術家仍然將靈魂和意圖帶給他們的音樂,AI幫助將這些想法栩栩如生。我們很高興每天都在擁抱這個工具,並在創作過程中找到快樂。

音樂家和製作人如何回應即興的能力?您是否看到過該工具的任何意外或創新用途?

回應真是令人難以置信。幾年前,有一些人開始使用這些工具,但是現在每個星期都有擁抱技術的專業音樂家和製作人的數量正在急劇擴展。我們已經看到,藝術家使用即將重新播放新的旋律,製作新的聲音,甚至創作整張專輯。一些人將Riffusion的幾代人與實時儀器融合在一起,以創建全新的流派。最令人興奮的事情之一就是看到人們如何採用此工具並自己製作自己的工具,無論是從自然的聲音中產生音樂,測試實驗作品還是為電影製作而得分。

現在,即將來臨可以創造長形式的音樂,您是否看到在電影,視頻遊戲或其他媒體中獲得AI生成的分數的潛力?

產生長格式音樂的能力無疑使即興演奏成為更大的媒體景觀的強大工具。我們已經看到了電影製片人,遊戲開發人員和內容創作者的興趣,他們想要適應其敘事的獨特分數,甚至可能是實時的。很明顯,AI可以幫助講故事的人跨模式表達自己,而我們正處於這個領域的開始。

展望未來,您對複興的最終願景是什麼?您如何看待它塑造音樂創作的未來?

如今,只有一小部分人製作音樂,但是創造力是我們所有人固有的。通過構建降低進入障礙的工具,同時還可以提高聲音可能的天花板,即將來臨將成為重要的工具。對於任何希望通過音樂創建,實驗和連接的人來說,我都認為即將到來。無論您是專業製作人還是以前從未創作過歌曲的人,我們都希望Riffusion成為幫助您找到聲音的樂器。

感謝您的出色採訪,有興趣產生一些音樂的用戶應該訪問Riffusion。

Source link

Scroll to Top