阿里云百炼平台Qwen3.7-Max默认开启隐式缓存 命中缓存后成本约为20%
2026-5-27 07:53:37 Author: www.landian.news(查看原文) 阅读量:4 收藏

#人工智能 阿里云百炼平台为 Qwen3.7-Max 模型默认开启隐式缓存,在不增加额外创建成本的情况下,命中缓存后成本为 20%。默认开启隐式缓存有助于降低开发者的实际调用成本,但隐式缓存命中率是完全不确定的,因此其效果不如显式缓存,开发者可以根据实际场景进行调整。查看详情:https://ourl.co/113115

阿里云通义千问团队日前宣布在百炼模型调用平台为阿里云旗舰模型 Qwen3.7-Max 默认开启隐式缓存,隐式缓存功能在默认开启后无法关闭,在实际使用时可以降低模型调用成本,命中隐式缓存的情况下模型实际调用价格为输入单价的 20%。按照当前 Qwen3.7-Max 输入价 12 元计算,在命中隐式缓存的情况下实际价格为 2.4 元。

阿里云百炼平台Qwen3.7-Max默认开启隐式缓存 命中缓存后成本约为20%

什么是隐式缓存:

隐式缓存主要用于追求便捷的通用场景,系统会自动识别请求内容的公共前缀并进行缓存,当系统收到请求后会基于前缀匹配原则检查缓存中是否存在请求中消息数组内容的公共前缀,若命中缓存则系统直接使用缓存结果进行后续部分的推理,若未命中缓存则系统按照常规流程进行处理,同时将本次提示词的前缀存入缓存以备后续请求使用。

在隐式缓存中系统无法确定缓存命中率、缓存命中概率并非 100%,有时候即便请求内容完全相同可能也无法命中缓存,具体请求内容能否命中缓存完全由系统判定,同时系统也会定期清理长期未使用的缓存数据,缓存清理时间同样不确定。

与隐式缓存互斥的是显式缓存,显式缓存首次创建缓存的成本要比正常输入高 25%,但显式缓存在 5 分钟有效期内的命中率可以做到 100%,而命中缓存后的调用成本为输入单价的 10%,因此开发者需要仔细分析自己的使用场景和数据来判断使用哪种缓存方式的成本更低。

隐式缓存与显式缓存的价格对比:

  • 创建缓存成本:隐式缓存创建价格与标准输入价相同,显式缓存创建价格是标准输入价的 125%
  • 命中缓存成本:隐式缓存命中后价格是标准输入价的 20%,显式缓存命中后价格是标准输入价的 10%
  • 最小缓存数量:隐式缓存最小缓存数量为 256Tokens,显式缓存最小缓存数量为 1024Tokens
  • 缓存生存时间:隐式缓存生存时间不确定完全由系统判断并清理,显式缓存生存时间为 5 分钟 (命中后会自动续期)
  • 缓存类型互斥:隐式缓存与显式缓存互斥,如未主动开启显式缓存的情况下,则系统默认使用隐式缓存

隐式缓存实践与计费:

隐式缓存的命中逻辑是判断不同请求的前缀是否存在重复内容,如果存在重复内容则可能可以命中缓存,因此为提高缓存命中率请将重复内容放在提示词的开头,将任何差异内容放在提示词的结尾部分,这样有助于提高隐式缓存的整体命中率并降低实际调用成本。

此次阿里云百炼平台为 Qwen3.7-Max 模型默认开启隐式缓存,但阿里云提供的其他模型 (包括其他 AI 公司的模型) 也陆续支持隐式缓存,具体价格以模型类型和提供方不同存在差异,开发者需要前往百炼控制台切换不同的模型查看价格。

PS:深度求索 API 平台调用 DeepSeek V4 Pro 命中缓存的情况下可节省 99.17%。

版权声明:
感谢您的阅读,本文由 @山外的鸭子哥 转载或编译,如您需要继续转载此内容请务必以超链接(而非纯文本链接)标注原始来源。原始内容来源:阿里云


文章来源: https://www.landian.news/archives/113115.html
如有侵权请联系:admin#unsafe.sh