去中心化社交网络长毛象(Mastodon)更新使用条款禁止抓取数据用于训练AI模型

#社交网络去中心化社交网络长毛象 Mastodon 更新使用条款，禁止任何未经授权的抓取数据用于训练 AI 模型的行为。此次条款更新最重要的变化就是禁止抓取数据训练模型，此前包括 X/、Reddit 等都已经更新条款增加类似的限制。查看全文：https://ourl.co/109406

去中心化社交网络平台长毛象 (Mastodon) 日前向用户发送电子邮件提醒该平台的使用协议已经更新，此次协议更新最大的变化就是禁止未经授权抓取用户数据。

新的使用条款将在 2025 年 7 月 1 日生效，生效后如果 AI 公司仍然未经授权抓取数据则可能会被长毛象起诉，此前社交网络平台 X/Twitter 和网络论坛 Reddit 都已经更新协议禁止抓取数据用于训练 AI 模型。

长毛象在电子邮件通知中表示：

我们明确禁止出于未经授权的目的 (例如存档或大型语言模型训练) 抓取用户数据，我们想要明确表示：不允许在我们的实例上使用 Mastodon 用户的数据来训练 AI。

在更新的协议中添加以下条款：

使用、启动、开发或分发任何自动化系统，包括但不限于任何蜘蛛、机器人、作弊工具、爬虫、离线阅读器或任何数据挖掘或类似的数据收集提取工具来访问实例，例外情况是标准搜索引擎或互联网浏览器和本地缓存的结果，或人工审查和与实例上的内容交互的结果。

值得注意的是这些条款仅适用于长毛象控制的 Mastodon.Social 服务器，该服务器只是分布式联邦宇宙网络的一个实例，如果其他联邦宇宙服务器实例的服务条款没有明确禁止，则数据抓取工具仍然可以从这些服务器获取数据并用于训练人工智能模型。

不过有可能其他服务器 / 实例也会跟进长毛象官方服务器的行为，采用相同服务条款禁止人工智能公司抓取数据训练 AI，对社交网络平台来说用户数据就是最宝贵的财富，被这些平台直接抓取训练 AI 确实是个巨大的损失。