谷歌为Gemini新增上传音频功能 可以通过AI处理音频并进行转录和分析等
谷歌更新Gemini AI,新增音频上传功能,支持MP3、WAV等格式转录和摘要生成。免费版每次最多10个文件、总时长10分钟;付费版可上传180分钟。 2025-9-9 07:58:20 Author: www.landiannews.com(查看原文) 阅读量:13 收藏

#人工智能 谷歌更新 Gemini AI 带来音频上传功能支持上传 MP3/WAV 等常见音频文件进行分析,包括将录音转录为文字等。其中免费版每次最多上传 10 个音频文件且总时长不超过 10 分钟,付费版最长可以上传 180 分钟的音频进行转录。查看全文:https://ourl.co/110589

尽管谷歌的 Gemini AI 已经可以处理图片、PDF 文件甚至上传视频文件进行分析,但谷歌此前并没有带来音频文件的支持,对于喜欢使用 AI 总结会议音频的用户来说是个遗憾。

所以现在谷歌要为用户带来音频文件的支持,谷歌实验室副总裁兼 Gemini AI 团队负责人已经确认此次更新并将其称为首要请求,用户可以在 Gemini AI 网页版、iOS 版和 Android 版上上传音频文件。

谷歌为Gemini新增上传音频功能 可以通过AI处理音频并进行转录和分析等

支持的音频文件格式包括 MP3、WAV 及其他大多数常见的音频格式文件,上传音频文件后可以交给 AI 将音频内容转录为文字,或者直接要求生成摘要例如会议的重点内容等。

当然付费用户和免费用户获得的权益是不同的,其中免费用户每次最多可以上传 10 个音频文件片段,并且所有音频文件的总和时长不超过 10 分钟,用户也可以尝试分次进行上传和分析。

如果是付费用户包括 Google AI Pro 或 Google AI Ultra 等订阅,则可以上传最多 3 小时也就是 180 分钟的音频文件,这可以满足大多数会议音频或其他音频的分析需求。

对免费用户来说 10 分钟确实有些少,例如较长的会议音频录音可能有 30 分钟甚至更久,这种情况下用户就需要考虑付费订阅 Google AI 服务以获得更高的使用配额了。

山外的鸭子哥

山外的鸭子哥

蓝点网站长,如果发现本文存在错误或错别字,欢迎在评论区留言,收到消息后我将及时修改。其他事宜请点击本站任意页面底部的「与我们联系」获取邮箱。

2.42W761.71M1.65W10.22M¥30


文章来源: https://www.landiannews.com/archives/110589.html
如有侵权请联系:admin#unsafe.sh