离谱!安娜的档案抓取了 8600 万个音乐文件,300TB 的 Spotify 数据!
安娜的档案昨天发布了一篇博客《Backing up Spotify》,很离谱:备份了音乐流媒体平台 Spotify 约 300TB 的数据,包括 8000 万个音乐文件(占 Spotify 播放总量的 99.6%)。@Appinn
其他的内容还包括 2.56 亿首曲目和 1.86 亿个独特的 ISRC(国际标准录音制品编码)。


安娜的档案都保存了 Spotify 得什么数据?
具体来说:
- Spotify 的 2.56 亿首歌曲的元数据(占全部的99.9%)
- 约 8600 万首音乐文件,约 300TB(占全部的99.6%)
- 音质保持为原始的 OGG Vorbis 格式,码率为 160kbit/s
- 无播放的音乐被重新编码为 75kbps 的 OGG Opus 格式
- 截止日期为 2025 年 7 月
并且还放出了一个最流行的1万首音乐列表,已证实真实性 ![]()

这是迄今为止公开可用的最大的音乐元数据数据库
这是世界上第一个完全开放的“音乐保存档案馆”
安娜还说…
作为对比,我们拥有 2.56 亿首曲目,而其他数据库只有 5000 万到 1.5 亿首。我们的数据注释完善: MusicBrainz 拥有 500 万个独特的 ISRC 代码,而我们的数据库则拥有 1.86 亿个。
就…很离谱。
分阶段发布
由于尺寸过于庞大(300TB),安娜的档案采用分阶段发布,目前仅发布了元数据:
- [X] 元数据(2025 年 12 月)
- [ ] 音乐文件(按受欢迎程度排序)
- [ ] 附加文件元数据(种子路径和校验和)
- [ ] 专辑封面
- [ ] .zstdpatch 文件(用于重建添加嵌入式元数据之前的原始文件)
“目前这是一个仅提供种子下载的存档,旨在保存资源。”
一些统计数据
根据这些文件,还有一些有趣的统计数据:
歌曲受欢迎程度:

≥70% 的歌曲几乎无人问津(播放量 < 1000)

歌曲的受欢迎程度以 0 到 100 之间的数值表示,100 代表最受欢迎,排名前 10,000 的歌曲涵盖了流行度 70-100。
最流行的三首歌
| Artists 艺术家 | Name 姓名 | Popularity 人气 | Stream Count 流媒体播放量 |
|---|---|---|---|
| Lady Gaga, Bruno Mars Lady Gaga、Bruno Mars | Die With A Smile 带着微笑死去 | 100 | 3.075 Billion 30.75亿 |
| Billie Eilish 比莉·艾利什 | BIRDS OF A FEATHER 物以类聚 | 98 | 3.137 Billion 31.37亿 |
| Bad Bunny 坏兔子 | DtMF | 98 | 1.124 Billion 11.24亿 |
还有一些数据,大家自己看吧 ![]()

话说回来,300TB 青小蛙表示把家里的手机空间加起来,也下不回来,看看就好了。
原文:https://www.appinn.com/annas-archive-backing-up-spotify/
相关阅读
- annas-mcp – 安娜的档案 MCP 服务器与 CLI 工具
- 安娜的档案发布了 521.1TB 的种子文件,还包含了创世纪图书馆、Sci-Hub 的内容
- Archiveror – 一键存档,永久保存任何在线网页内容
- Spotube – 开源、跨平台 Spotify 客户端,无需 Premium 账号,也没有使用 Electron
- Lyricify – 为 Spotify、iTunes、Music Center、QQ音乐、网易云音乐、YesPlayMusic 提供滚动歌词[Windows]
©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。