AI 助手在 45% 的时间里曲解新闻内容

AI 助手在 45% 的时间里曲解新闻内容
欧洲广播联盟协调的大型研究发现，AI助手在45%的情况下曲解新闻内容。测试了ChatGPT、Copilot、Gemini和Perplexity四大平台。结果显示45%的答案存在重大问题；31%存在严重信息源问题；20%有重大精确性问题；Gemini表现最差，76%的答案存在问题。 2025-10-22 14:55:42 Author: www.solidot.org(查看原文) 阅读量:1 收藏

由欧洲广播联盟 (EBU) 协调，BBC 牵头的一项大型研究发现，不管测试哪种语言，位于哪个地区和使用哪个平台，AI 助手在 45% 的时间里曲解新闻内容。研究测试了 ChatGPT、Copilot、Gemini 和 Perplexity 四大 AI 平台。结果显示，45% 的 AI 答案至少存在一个大问题；31% 的答案存在严重的信息源问题；20% 存在重大的精确性问题，包含了虚构的细节和过时的信息；Gemini 表现最差，76% 的答案存在重大问题；是其它 AI 助手的两倍多，这主要归咎于其信息源问题。

https://www.bbc.co.uk/mediacentre/2025/new-ebu-research-ai-assistants-news-content

文章来源: https://www.solidot.org/story?sid=82612
如有侵权请联系:admin#unsafe.sh