4月10日,#openai 的CEO @sama 在日本自民党的AI发展第九次会议上以【ChatGPT的活用和其他技术以及对日本的建议】为题做了宣讲,众议院议员 塩崎あきひさ 将上传了可公开的资料,其中就包括SAM的PPT。本thread讲对此进行翻译和解读。
前1~3页是公司简介:
OpenAI的使命是确保通用人工智能(AGI)惠及全人类。
OpenAI,独一无二的 "公司",
7年前作为一个非营利组织成立
4年前意识到:纯粹的非营利组织是不够的
发展需要大量的计算资源和顶尖人才
建立一个 "封顶(capped-profit))的营利性公司 "来筹集资金
保持社会使命
营利法人由一个非营利组织管理
非营利性董事会大多数是独立的
社会使命优先于所有其他被考虑的因素
第四到第七页介绍的是:“开发和业务开展”
GPT-3和OpenAI API(2020)。
GPT-3(2020年5月)
机器学习和人工智能的历史性时刻
"第一个通用人工智能 "语言和代码
让"Few-shot "可以 "通用"
大规模语言模型的起源
微软GitHub Copilot模型(Codex):革新编程(2021年)
OpenAI API(2020年9月)
API使任何人都可以在没有计算环境或GPU的情况下轻松使用GPT-3
9个月内创建了300个应用程序
ChatGPT (2022年11月)
经过微调的GPT-3模型
问答式
互动式
安全性
"类人"
插件工具使用(2023年3月)
互联网搜索(2023年3月)
5天内达成100万用户
第一个 "通用 "交互式机器人
GPT-4 (2023年3月)
OpenAI最先进的模型
支持自然语言、代码和图像
"第三种通用人工智能"
广泛的常识和解决问题的能力,更精确地解决困难问题
司法考试
大学水平的科学和数学
编程竞赛
支持ChatGPT。在发布之前,花了六个月时间进行安全验证和微调。
DALLE(2021年1月-)
第一个 "文本到图像 "模型
开源CLIP(2021年1月)
所有 "文本图像 "都得到活用
Whisper(2022年9月)
世界上最好的语音识别(ASR)模型,具有高质量、轻量级和多语言支持
对方言、背景噪音和行话的准确转录非常出色
经过充分的安全验证后开放源代码 → 已经由印度政府实施
在日本也全面采用,例如 "Pocket Talk for BUSINESS"。
第8页到10页是“实际成果:企业合作”
各行各业数以千计的公司使用我们的API。
教育 khanacademy
在线支付 stripe
语言学习 duolingo
广告 waymark
SIer Bain & Company
案例研究 MorganStanley
数据:包含数十万页的内容库,涵盖投资策略、市场研究和评论、分析师的见解等。大部分是PDF。
问题:很难为客户找到正确的信息或定制建议。
解决方案:使用人工智能助手(现在是ChatGPT搜索插件),结合embeddings与completions,帮助顾问快速找到并整合答案。
结果:大大减少了从庞大的知识库中检索相关信息所需的努力。
11到14页是“安全和调和”
“确保人工智能系统的开发、部署和使用安全”对我们的任务至关重要。
为什么要通过API发布技术
在应用部署前进行筛选,检测滥用情况
帮助开发者扩展他们的应用
在3个月内将ChatGPT成本削减到1/20。立即提供给API开发者。
研究每一项OpenAI技术的多方面影响。
将安全并对社会有益的基础技术开源(Whisper、CLIP、Point-E、Tiktoken、ChatGPT检索插件、OpenAI Cookbook、OpenAI Evals,等等)。
人工智能与人类价值观的调和
确保AGI造福全人类的一个重要部分是使人工智能系统与人类的意图和价值观对接。
这被称为 "调和"。
作为OpenAI研究的重中之重,调和团队研究如何有利地、正确地、安全地训练AI系统。
例如:在发布GPT-4之前,安全方面进行了六个月的测试。
15到23是:“使用例”。
AI的使用提高整体社会生产力和便利性。 对日本来说:语言和IT障碍被消除了。任何人都可以通过OpenAI API + ChatGPT使用人工智能技术,无需英语或编程。
图上的例子是直接和其他语言的资料对话—使用的是我们最常用的从英文文章里生成母语摘要功能。
这个例子则是让ChatGPT模仿大阪的大妈,用关西腔给你回答有关深度学习的问题,最后还发给你一颗糖😄
从系统日志中进行自动和异常检测,并给出处理建议。
例子: 插件和搜索
10年的联合国文本 "瞬间 "变成ChatGPT知识。
搜索插件的代码也是开源的。
使用被极度低估的text-embedding-ada-002向量搜索,又快又便宜。
例子4: 图像+语言。
万能的图像理解模型。
高性能OCR也能通过自主学习得出。
支持日语
第一个例子是让GPT-4解释图片上有什么异常,在之前的报告里。第二个则是让GPT-4自行OCR并将文字翻译成日语。
最后一个例子
自2012年以来,BeMyEyes 为超过2.5亿的盲人或视力障碍者开发了辅助技术。 这家丹麦初创公司提供的服务将视力障碍者与志愿者联系起来,协助他们完成日常工作,如识别产品或在机场导航。 (唯一可使用GPT-4图像API的公司)
如果这篇有帮助,请订阅转发,也可以fo我的推特。我将带给你更多关于Web3,Layer2,AI,以及日本相关咨询: