#人工智能 维基百科上线人工智能 API 数据抓取服务,敦促 AI 公司付费购买 API 确保维基百科能够继续运营。API 服务为 AI 公司提供更便捷的数据抓取服务,同时也能为维基百科贡献资金支持其运营,目前维基百科还未说要封锁那些 AI 公司的爬虫,不过很可能未来维基百科也会这么做避免 AI 爬虫泛滥消耗海量服务器资源。查看全文:https://ourl.co/111130
在人工智能时代传统网站遭到冲击是不可避免的,哪怕像是维基百科这种规模的网站也面临流量不断下降的局面,尽管大多数人工智能模型的训练数据都包含维基百科的内容。
现在维基媒体基金会宣布向人工智能公司推出付费 API 服务,人工智能公司可以直接通过购买 API 的方式便捷获取维基百科上的内容用来训练数据或者提供即时问答。
付费 API 服务既可以让维基百科继续获得必要的资金维持运营,又可以为人工智能公司提供更便捷的数据服务,至少维基媒体基金会认为这应该是双赢的,而且不会因为爬虫肆意抓取导致维基百科面临服务器资源紧张问题。
维基媒体基金会至少目前并未明确威胁要对网络爬虫进行处罚或者采取法律行动,不过维基百科最近指出,部分 AI 机器人坚持伪装为人类来抓取维基百科上的内容。
维基百科在更新机器人检测系统后,发现 2025 年 5~6 月异常高的访问量就来自试图躲避检测的 AI 爬虫,与此同时,维基百科称人类访问维基百科的流量已经下滑 8%。
现在维基百科正在制定人工智能开发者和提供商的指导方针,认为生成式人工智能开发者应当注明内容出处以感谢人类贡献者,因为这些人类贡献者的内容被用作 AI 模型输出结果的依据。
维基百科在公告中表示:
为了让人们信任互联网上分享的信息,平台应该明确标明信息的来源,并提供更多机会让用户访问和参与这些信息来源,如果维基百科的访问量减少,参与内容扩充和丰富工作的志愿者就会减少,支持这项工作的个人援助者同样也会减少。
如果维基百科不寻求方法改变目前的局面,假以时日维基百科的流量可能会大跌,最终缺乏人类贡献者编辑和校验内容,而人工智能也无法继续获取优质数据训练模型,也无法在即时回答中引用更新的数据。
via Wikipedia
蓝点网站长,如果发现本文存在错误或错别字,欢迎在评论区留言,收到消息后我将及时修改。其他事宜请点击本站任意页面底部的「与我们联系」获取邮箱。
2.45W797.43M1.65W10.50M¥30

