​AI 音樂創作新趨勢:杭州男子月入十幾萬,40 秒生成一首歌

2026年6月5日 09:31

重點摘要

杭州一從業者利用AI音樂工具,上傳圖片後40秒內生成完整歌曲,曲風多樣且人聲逼真,難以分辨真假。通過低成本批量製作併發布至音樂及短視頻平臺,他月收入超十萬元,展現了AI技術在音樂創作領域的商業潛力。

站內 AI 整理稿

### AI 音樂創作新趨勢:杭州男子月入十幾萬,40 秒生成一首歌

#### 重點整理:AI 音樂工具開啟低門檻商業模式

近期一則來自杭州的案例引發關注:一名音樂相關從業者運用 AI 音樂生成工具,只要上傳一張圖片,就能在 40 秒內產出一首完整的歌曲,不僅曲風多元,連人聲也相當逼真,幾乎難以分辨是真人演唱還是 AI 合成。透過低成本、高速度的批量製作,再將這些歌曲發布到音樂平台與短視頻平台,他每個月的收入突破十萬元新台幣(約十幾萬人民幣)。這則消息具體展現了 AI 技術在音樂創作領域的商業潛力,也讓外界重新思考音樂產業的生產模式。

#### 背景脈絡:從專業門檻到全民創作

過去,創作一首完整的歌曲需要具備樂理知識、樂器演奏能力、錄音設備,甚至還要找歌手、混音師,整個流程耗時且成本高昂。然而,隨著 AI 音樂生成技術在近兩年快速成熟,類似 Suno、Udio、Stable Audio 等工具已能根據文字描述或圖片自動產生旋律、編曲與人聲。杭州這位創作者正是利用這類工具,將原本需要數天甚至數週的製作流程壓縮到一分鐘以內。此外,短視頻平台對「背景音樂」的需求極大,許多創作者需要大量的、版權清晰的音樂來搭配內容,這也為 AI 生成歌曲提供了穩定的變現通路。

#### 可能影響:音樂人的挑戰與新機會

這項技術的普及首先衝擊傳統音樂工作者——作曲人、編曲人、配樂師等可能面臨工作機會減少,因為 AI 生成的歌曲在品質上已能滿足多數商業用途(如直播背景音樂、廣告配樂、短視頻 BGM)。另一方面,AI 也帶來新的機會:懂得利用 AI 工具的創作者可以大幅提升產量,甚至一人身兼詞曲、演唱、發行等多重角色,形成「個人音樂工廠」模式。但需注意的是,AI 生成的音樂是否涉及模仿知名歌手聲音、是否侵犯現有音樂版權,目前仍處於法律灰色地帶。台灣與各國監管單位正逐步討論 AI 生成內容的標示義務與權利歸屬。

#### 讀者可關注的後續發展

**一、平台規範與版權爭議**:YouTube、抖音、Spotify 等平台近期已開始要求上傳者標註 AI 生成內容,未來可能進一步限制未經授權的 AI 模仿聲音。音樂著作權集體管理團體也可能提出新的收費標準。

**二、音樂教育與創作門檻的改變**:學校與音樂教室是否需要調整課程,從教導樂器演奏轉向教導如何「與 AI 協作」?職業音樂人該如何轉型為「AI 音樂導演」?

**三、就業市場的兩極化**:低端音樂製作(如罐頭配樂、婚禮歌曲)可能被 AI 取代;但高品質、具獨特風格的創作(如演唱會級別管弦樂、實驗性音樂)仍需要人類藝術家的靈感與情感注入。

**四、消費者識別能力**:當 AI 歌曲與真人演唱越來越難分辨,聽眾是否會逐漸失去對「真實表演」的信任?這也反過來影響偶像產業與現場演出的價值。

總之,杭州男子的高收入案例只是 AI 音樂浪潮的冰山一角。未來幾個月,我們可以觀察更多個人創作者如何複製這套模式,以及傳統唱片公司會推出什麼樣的應對策略。對於一般讀者,不妨實際體驗一次 AI 音樂工具,感受技術的成熟度,同時開始思考:在 AI 能「40 秒創作」的時代,什麼才是音樂真正的靈魂?

Related

相關文章

鈦媒體生成式AI

Edge AI Daily 早報(6月19日)

AI Engineer World's Fair 2026規模再創新高,標誌AI工程從幕後走向舞臺中央。行業面臨結構性調整:楊立昆警示OpenAI年虧210億美元揭示商業模式脆弱性,Transformer之父轉投OpenAI反映人才爭奪白熱化。Anthropic多線佈局——語音支持七種語言、加入碳清除聯盟、落子首爾辦事處,展現生態擴張野心。監管壓力加劇,意大利依據DMA調查蘋果iCloud,巴西開放iOS側載佣金降至5%,蘋果圍牆花園持續崩塌。

3 小時前
智東西生成式AI

谷歌時隔6年再發智能音箱,Gemini上桌,售價不到700元

智東西 編譯 | 劉煜 編輯 | 陳駿達 智東西6月18日消息,谷歌昨日宣佈,其首款搭載居家版Gemini語音助手的智能音箱(Google Home Speaker)已開啟預售,將於當地時間6月25日正式上市,售價為99.99美元(約合人民幣677.03元)。在此之前,谷歌已有6年沒有推出過獨立智能音箱產品。 谷歌這款智能音箱外觀近似球形,風格類似亞馬遜新一代Echo音箱與蘋果舊款音箱HomePod Mini。 ▲谷歌智能音箱(圖源:谷歌官網) 使用音箱時,用戶只需通過口令“Hey Google”或“OK Google”喚醒Gemini,就可以繼續下達相應指令。這與谷歌舊款音箱、智能顯示屏等喚醒語音助手的方式相同。此外,用戶只要按照日常說話習慣下達命令,Gemini便能理解用戶意圖,相比之前大大提升溝通效率。 一、加強短時對話記憶,會員可與Gemini不限次數對話 谷歌此次推出的全新音箱升級諸多功能。其中,音箱搭載的Gemini語音助手擁有10款全新擬人化語音音色,用戶可以根據喜好自行選擇聲線。音箱還可支持用戶一次性下達多條語音指令,即使指令未能說對、說完整,用戶中途改口Gemini也能識別。 Gemini還具備多鏈路推理能力,落地到實際生活場景中比較實用。例如,用戶問:“我支持的足球隊下場比賽天氣如何?”Gemini收到指令後,會自動查詢賽事時間、舉辦地點,同時匹配相應時段天氣,再給出答覆。 同時,Gemini加強了短時對話記憶,能承接上下文實現連續對話功能。即使用戶連續追問、甚至串聯多項任務、不重複交代前置條件,該語音助手也能實現來回連貫交流。 ▲谷歌Gemini對話場景(圖源:谷歌官網) 不僅如此,Gemini搭配的連續對話功能,能讓應答後的音箱麥克風保持短暫收音,用戶無需重複喊“OK Google”就能繼續提問。該功能現已全面支持所有Gemini原生適配的語言,包括

23 小時前

微軟,考慮接入DeepSeek

這篇消息聚焦「微軟,考慮接入DeepSeek」。原始導語提到:Copilot Cowork轉為按量計費。 從 AI 情報角度來看,這類內容值得關注其背後的技術進展、產品落地、產業競爭與後續市場影響。

1 天前