OpenAI在其API中推出新的语音智能功能
AI公司OpenAI周四表示,其 API现在将包括一系列新的语音智能功能,旨在帮助开发者创建能够与用户进行对话、转录以及翻译对话的应用。该公司的新款GPT‑Realtime‑2是另一个语音模型,旨在创 2026-5-8 03:3:39 Author: blog.upx8.com(查看原文) 阅读量:4 收藏

AI公司OpenAI周四表示,其 API现在将包括一系列新的语音智能功能,旨在帮助开发者创建能够与用户进行对话、转录以及翻译对话的应用。该公司的新款GPT‑Realtime‑2是另一个语音模型,旨在创建能够与用户对话的逼真语音模拟。然而,与其前代模型不同的是,这款模型采用了 GPT‑5 级别的推理能力,OpenAI公司表示该推理能力是为了处理用户更复杂的请求而创建的。该公司还推出了GPT‑Realtime‑Translate,正如其名,旨在提供与用户对话节奏 “保持同步” 的实时翻译服务。该功能包括超过70种输入语言和13种输出语言。最后,还推出了一项新的转录功能GPT‑Realtime‑Whisper,为用户提供在交互发生时即时捕捉的实时语音转文本功能。

—— Techcrunch


文章来源: https://blog.upx8.com/OpenAI%E5%9C%A8%E5%85%B6API%E4%B8%AD%E6%8E%A8%E5%87%BA%E6%96%B0%E7%9A%84%E8%AF%AD%E9%9F%B3%E6%99%BA%E8%83%BD%E5%8A%9F%E8%83%BD
如有侵权请联系:admin#unsafe.sh