AI 助手在 45% 的时间里曲解新闻内容
欧洲广播联盟协调的大型研究发现,AI助手在45%的情况下曲解新闻内容。测试了ChatGPT、Copilot、Gemini和Perplexity四大平台。结果显示45%的答案存在重大问题;31%存在严重信息源问题;20%有重大精确性问题;Gemini表现最差,76%的答案存在问题。 2025-10-22 14:55:42 Author: www.solidot.org(查看原文) 阅读量:1 收藏

由欧洲广播联盟 (EBU) 协调,BBC 牵头的一项大型研究发现,不管测试哪种语言,位于哪个地区和使用哪个平台,AI 助手在 45% 的时间里曲解新闻内容。研究测试了 ChatGPT、Copilot、Gemini 和 Perplexity 四大 AI 平台。结果显示,45% 的 AI 答案至少存在一个大问题;31% 的答案存在严重的信息源问题;20% 存在重大的精确性问题,包含了虚构的细节和过时的信息;Gemini 表现最差,76% 的答案存在重大问题;是其它 AI 助手的两倍多,这主要归咎于其信息源问题。

https://www.bbc.co.uk/mediacentre/2025/new-ebu-research-ai-assistants-news-content


文章来源: https://www.solidot.org/story?sid=82612
如有侵权请联系:admin#unsafe.sh