#人工智能 GitHub 宣布从 4 月 24 日起收集开发者使用 Copilot 的交互数据,数据将被 GitHub 或微软等用于训练 AI 模型。被收集的数据包括:发送到 AI 的文字或代码片段、光标周围的代码上下文、开发者撰写的评论和文档、存储库结构等等。查看全文:https://ourl.co/112349
GitHub 日前发布公告宣布从 2026 年 4 月 24 日起修改 AI 编程辅助工具 GitHub Copilot 的数据使用方式,简单来说后续开发者交互数据将被收集并用于训练和改进 AI 模型。
开发者使用 AI 编程工具时需要输入数据 (包括代码片段和上下文等),AI 模型也会给出针对性的回答或代码,这些数据可能包含某些敏感内容,因此开发者应当退出数据训练计划。
GitHub 允许开发者在隐私设置中退出数据收集和训练,此前已经手动设置退出的开发者也不受影响,GitHub 会保留开发者主动设置的隐私状态。
至于收集数据的原因则是 GitHub 希望使用这些数据来训练和改进 AI 模型,以便向用户提供更加智能和具有上下文感知能力的编程辅助功能。
下面是 GitHub 将收集的数据:
- 开发者接受或修改的输出结果
- 发送到 GitHub Copilot 的输入,包括向模型提供的代码片段
- 光标周围的代码上下文
- 开发者撰写的评论和文档
- 文件名、存储库结构和导航模式
- 与 Copilot 功能 (例如聊天和在线建议等) 的交互内容
- 开发者对建议的反馈,包括点赞或踩
默认数据收集计划从 2026 年 4 月 24 日起覆盖 GitHub Copilot Free、GitHub Copilot Pro 和 GitHub Copilot Pro + 用户,商业版和企业版默认不会被收集任何交互数据。
另外 GitHub 也强调收集的数据可能会与关联公司共享,这些关联公司包括微软和微软旗下的其他公司,但不会提供给无关的模型提供商使用。
如何退出数据共享计划:
转到 GitHub Copilot 设置,将允许数据用于模型训练禁用即可,路径如下:GitHub 设置、Copilot、Features、Privacy、Allow GitHub to use my data for AI Model training。
