#人工智能 OpenAI 发布全新的图像生成模型 Images 2.0,新模型在图片生成细节、逻辑和可用性等方面带来显著提升。对中文用户而言新模型最直接的提升就是生成中文字符时乱码情况大幅度减少,虽然还有乱码但数量已经减少许多。查看详情:https://ourl.co/112780
OpenAI 昨天夜里发布全新的图像生成模型 Images 2.0,新模型的进步不仅仅是清晰度更高,而是在图片生成细节、逻辑以及可用性等方面带来显著提升。
如果说过去的 AI 生成图片已经可以做到以假乱真,那现在升级版的 Images 2.0 模型则是让 AI 真正开始理解自己在画什么,而不是仅仅按照用户要求生成存在逻辑错误的图片。
例如之前的图像生成模型仔细看就能发现细节存在错误,包括文字乱码、手指奇怪和逻辑混乱,尤其是中文字符方面乱码的比较严重,Images 2.0 中文字符仍然可能存在极少的乱码,但整体密集生成中文字符已经没有太大的问题。
新模型的亮点包括:
- 在图像生成质量、可靠性、文本渲染、复杂理解方面有着非常显著的升级
- 生成的图像现在提供更高质量的光影、色彩、细节和真实感,而不是看起来就是 AI 生成的
- 文本渲染方面支持多语言、艺术字、排版设计,让图片文字内容看起来清晰准确
- 模型在复杂理解方面的能力显著提升,可以更好地理解长文本、复杂指令和细节要求
- 通过现有知识库和联网搜索知识,生成更贴合实际需求的图像
内容生产效率将大幅度提升:
Images 2.0 模型可以批量生成风格相同的多张图像 (每次最多为 8 张),这可以显著提升漫画与分镜制作、广告与品牌视觉套图、社交媒体内容批量生成、UI/UX 原型设计等领域的内容生产效率并缩短制作时间。
换言之,AI 生成图片开始具备系列化内容生产能力,而不仅仅只是单张图片生成,同时其使用场景也从创意扩展到更多专业领域,最终将为相关行业带来革命性的变革。
目前该模型已经开始逐步向 ChatGPT 付费订阅用户提供,API 平台也已经上线 Images 2.0 模型的调用,开发者可以在自己的应用里通过 API 快速生成图像。
