谷歌公司今日正式发布Data Commons模型上下文协议服务器(Data Commons Model Context Protocol Server,简称MCP Server),该工具旨在为标准化的Data Commons互联公共数据集提供访问接口。
构建统一知识图谱
Data Commons是谷歌于2018年推出的开放知识库,通过将经济、健康、人口统计和环境等领域的公共数据集组织并链接成统一图谱。该知识库最初旨在为研究人员、政策制定者和开发者提供可信统计数据,而随着今日MCP Server的发布,人工智能系统也成为其服务对象。
防范AI幻觉风险
新型Data Commons MCP Server为AI开发者和Agent构建者提供了可靠方法,使其输出结果基于可验证的统计数据,而非冒险陷入模型幻觉的陷阱。MCP服务器设计为标准接口,允许AI系统直接查询Data Commons,无需管理复杂的应用程序编程接口(API)。谷歌将MCP服务器定位为构建"数据密集型"Agent应用的基础设施,通过简化统计数据集访问实现这一目标。
无缝集成开发流程
该服务器通过谷歌Gemini命令行界面(CLI)和Agent开发工具包集成到现有开发工作流中,并提供示例Agent和Colab笔记本以实现快速原型设计。此举旨在让企业和独立开发者都能更轻松地创建Agent,使其推理过程可直接获取可靠上下文数据。
实际应用案例
谷歌在博客中展示了与ONE Campaign合作开发的ONE Data Agent应用案例。该Agent利用MCP服务器,帮助倡导者和政策制定者以自然语言探索全球卫生融资数据。用户可以查询哪些国家面临卫生预算脆弱性、生成对比图表或下载数据集进行深入分析。
"若要从传统数据库编制可靠报告,用户需要跨数据集操作并手动提取数据,"谷歌软件工程师Keyur Shah解释道,"而Agent能理解复杂查询,并能快速获取和编译所需数据。ONE Data Agent正在开创一个可访问、有影响力的数据驱动倡导新时代。"
跨行业应用前景
虽然目前仅有一个案例,但该功能可应用于多个领域。通过实现对可信数据集的自然语言访问,谷歌希望加速Agent应用在公共卫生、气候和经济规划等依赖真实数据的领域的普及。
Data Commons MCP Server还对AI输出准确性具有更广泛的意义。通过为大型语言模型提供"数据支柱",谷歌响应了市场对AI输出透明度和可信度日益增长的需求。
当然,MCP方法的有效性取决于数据新鲜度、覆盖范围、准确性和可解释性,这些正是全球统计系统面临的挑战。但这一举措正在缩小先进模型推理与决策者所依赖的结构化事实信息之间的差距。
参考来源:
Google debuts Data Commons MCP Server to ground AI agents in trusted data
本文为 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf
客服小蜜蜂(微信:freebee1024)