本篇文章更新時間:2025/12/22
如有資訊過時或語誤之處,歡迎使用 Contact 功能通知。
一介資男的 LINE 社群開站囉!歡迎入群聊聊~
如果本站內容對你有幫助,歡迎使用 BFX Pay 加密貨幣 或 新台幣 贊助支持。
內容目錄
Spotify 大備份:當一個影子圖書館開始拯救全世界的音樂
從 256M 曲目到 300TB 資料,Anna’s Archive 如何打造史上最大「音樂保存庫」
編輯前言:如果你以為數位音樂已經安全無虞,那麼這篇來自 Backing up Spotify 的文章會徹底改變你的想法。Anna’s Archive 做了一件瘋狂但必要的事:把 Spotify 的世界級音樂資料備份成能長久保存的開放式檔案。
核心觀點 (Key Takeaways)
- 他們抓下了 Spotify 幾乎完整的 256M 曲目 metadata,並保存了 86M 首歌的檔案。
- 這是首個真正開放、可被任何人鏡像的「音樂保存庫」,總量近 300TB。
- 為什麼需要這樣的備份?因為現在的音樂保存高度依賴商業平台,而長尾內容正不斷被遺忘與埋沒。
深入解析
Anna’s Archive 過去專注於書籍與論文,但這次跨界做音樂,是因為他們意識到「文化保存」不應侷限媒介。文章裡提到:
Spotify 並不是所有音樂的集合,但它是最好的起點。
理由其實很務實:當這個平台擁有 256M tracks,且每日都在影響全球的聆聽習慣,把它備份起來等於是保存了現代音樂文化的一塊龐大切片。
- 長尾內容正在消失:現有的音樂保存努力多半集中在熱門歌曲,真正需要被保存的是那些播放量 <1000 的龐大長尾曲目。
- 檔案太大難以保存:其他收藏者偏愛 FLAC 或極高品質音檔,儲存門檻太高,不利於建立完整資料庫。
- 沒有權威索引:不像書籍界有 LibGen + Sci-Hub,那樣的「全球音樂索引」至今不存在。
這次的 Spotify 大備份算是第一次有人嘗試建立「所有音樂」的完整地圖。
收錄範圍與策略
文章提到兩個重點:
- 約 99.9% 的 metadata 都被抓下來,這意味著連那些幾乎沒人聽的曲目資料也在其中。
- 約 86M 首音檔(約 300TB),涵蓋 99.6% 的實際收聽量。
音檔策略也滿務實:
- popularity > 0 的歌:保留原始 160k OGG,不重新編碼。
- popularity = 0:轉成 75k OGG Opus,節省空間。
換句話說,這是一個優化「文化保存 vs. 成本」的折衷方案。
元資料架構極度完整
文章後半深入介紹 SQLite 結構:tracks、artists、albums、audio features、playlists…乃至於市場可用範圍、語言標注、替代曲目等。這些資料本身就是極有研究價值的文化檔案。
我特別覺得這句很有意思:
這是史上最大、且真正公開的音樂 metadata database。
像 MusicBrainz 也不過 5M unique ISRC,而這份資料庫有 186M。
筆者心得與啟發
讀完這篇,我最大的感受是:原來我們以為理所當然可用的文化資產,其實脆弱得驚人。Spotify 下架專輯、換版本、替代曲目、AI 垃圾音樂充斥——這些我們每天都在經歷,但未必意識到背後的文化風險。
Anna’s Archive 的做法提醒我:
- 文化保存不是企業的責任,而是社群的責任。
- 數位世界比實體世界更容易遺失文化。
- 保存 metadata 就是在保存歷史脈絡。
如果你對音樂文化、資料保存或數位考古有興趣,這份 Spotify 大備份不僅是一份「盜取的檔案」,更是一個值得研究的文化地景圖。未來的音樂學家、資料科學家、AI 訓練者,甚至一般聽眾,都可能在 20 年後感謝這次「看似狂妄、其實必要」的行動。
我的建議是:就算你不 download 300TB,也至少 seed 一點 torrent,讓文化不至於只存在於企業伺服器的某個抽屜裡。
