安娜的档案抓取流媒体音乐平台Spotify高达300TB数据 包含8600万首歌曲 将做种分享
知名数据档案馆“安娜的档案”成功抓取流媒体音乐平台Spotify高达300TB的数据,包含8600万首歌曲,占总播放量的99.6%。数据将分阶段发布,高播放量歌曲以160kbits OGG Vorbis格式发布,低播放量歌曲以75kbits OGG Opus格式发布。目前仅元数据已发布。 2025-12-22 03:3:52 Author: www.landiannews.com(查看原文) 阅读量:2 收藏

#科技资讯 知名数据档案馆安娜的档案抓取流媒体音乐平台 Spotify 高达 300TB 的数据,包含 8600 万首歌曲,占总播放量的 99.6%。这部分数据将分阶段发布,其中播放量非零的歌曲以 160kbits 的原始 OGG Vorbis 格式发布,播放量为零的歌曲被重新编码为 75kbits 发布,暂时只有元数据已经发布。查看全文:https://ourl.co/111393

知名数据档案馆安娜的档案日前发布博客宣布已经成功备份几乎整个 Spotify 平台的音乐文件,后者是全球用户规模最大的流媒体音乐平台,此次被安娜的档案抓取应该是某些安全措施没有做到位导致的。

安娜的档案称,此前该档案馆发现某种能够大规模抓取 Spotify 平台数据的方法,随后该档案馆意识到或许可以通过数据建立用于保存音乐的音乐档案馆,接下来就是抓取数据。

安娜的档案抓取流媒体音乐平台Spotify高达300TB数据 包含8600万首歌曲 将做种分享

最终抓取的数据和概述如下:

Spotify 作为全球规模最大的流媒体音乐平台目前拥有 2.56 亿首歌曲,其中 99.9% 的歌曲已经被抓取;

安娜的档案成功存档 8600 万首音乐文件,约占总播放量的 99.6%,整体数据大小约为 300TB;

按照 Spotify 平台受欢迎程度来确定歌曲的优先级,用户可以查看排名前 10000 的歌曲榜单;

对于流行程度非零的歌曲几乎都已经抓取,75kbit/s 的 OGG Opus 格式;

添加元数据时没有对音频文件进行重新编码,但提供差异文件存档,包含原始哈希和元数据文件用于重建;

对于流行程度为零的歌曲大约抓取了 50%,音频被重新编码为 75kbit/s 的 OGG Opus 格式,这种音质较低但体积小;

数据截止至 2025 年 7 月,也就是在此之后上架的音乐或更新都不包含在下载数据内。

由于数据非常大安娜的档案将以 BT 种子形式发布数据,也就是说除非所有人都已经放弃这部分数据,否则数据将 BT 形式流传在整个互联网上,任何人想要将其彻底清除都几乎是不可能的事情。

不过需要说明的是目前数据还在构建并计划分阶段发布,暂时发布的数据只有歌曲的元数据,接下来音乐文件、附加文件元数据、专辑封面以及 zstdpatch 文件等都将分阶段发布,具体发布时间未知。

山外的鸭子哥

山外的鸭子哥

蓝点网站长,如果发现本文存在错误或错别字,欢迎在评论区留言,收到消息后我将及时修改。其他事宜请点击本站任意页面底部的「与我们联系」获取邮箱。

2.47W821.08M1.66W10.66M¥30


文章来源: https://www.landiannews.com/archives/111393.html
如有侵权请联系:admin#unsafe.sh