谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%

5 月 10 日消息,科技媒体 WinBuzzer 昨日(5 月 9 日)发布博文,报道称谷歌为其 Gemini 2.5 API,推出了“隐式缓存”(Implicit Caching)功能,自动识别并重用 API 请求中的常见前缀,开发者的成本最高可以降低 75%。

该功能适用于 Gemini 2.5 Pro 和 Gemini 2.5 Flash 模型,自动检测 API 请求中的重复前缀并加以重用,开发者的使用成本最高可以降低 75%。

注:与 2024 年 5 月推出的“显式缓存”(Explicit Caching)不同,隐式缓存无需开发者手动配置,系统默认开启,节省成本的同时大幅简化操作流程。

今日霍州(www.jrhz.info)©️

为帮助开发者充分利用隐式缓存,谷歌建议在构建提示词(prompt)时,将稳定、常见的内容放在开头,后面再添加用户特定的变量内容。此外,短时间内发送具有相似前缀的请求也能提高缓存命中率。

谷歌还设定了最低 Token 数量要求:Gemini 2.5 Flash 需 1024 个 Token,Gemini 2.5 Pro 则需 2048 个 Token。API 响应中新增的“cached_content_token_count”字段会显示缓存 Token 的使用情况和优惠计费详情。

与此同时,显式缓存仍作为可选方案,支持 Gemini 2.5 及 2.0 模型,允许开发者自定义缓存内容和生存时间(TTL,默认 1 小时)。

谷歌此举虽宣称成本节省 75%,但实际效果尚待第三方验证,且可能因使用模式不同而有所差异。

今日霍州(www.jrhz.info)©️

特别声明:[谷歌 Gemini 2.5 API 推“隐式缓存”,开发者成本最高降低 75%] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

印度尼帕疫情0号病人或来自医院 果蝠并非元凶(印度尼西亚疫情最新消息多少例)

印度西孟加拉邦最近暴发了尼帕病毒疫情,近百人被隔离,一名患者病危。这种病毒致死率高达75%,潜伏期最长可达45天,初期症状像感冒:发烧、头痛、呕吐。一旦恶化,会导致脑炎、抽搐、昏迷,甚至留下终身后遗症

印度尼帕疫情0号病人或来自医院 果蝠并非元凶(印度尼西亚疫情最新消息多少例)

茅台:“参与SpaceX上市融资”不实 官方辟谣市场传言

每经AI快讯,据上证报,今日,有市场传言称“贵州茅台证实参与SpaceX上市A轮融资”。记者对此进行了求证,贵州茅台方面回应记者称,此为“不实信息”

茅台:“参与SpaceX上市融资”不实 官方辟谣市场传言

满10卷送2卷!这种加压运动护具真的适合你吗?2026健身新潮流(满就送卷)

随着2026年全民健身热持续升温,越来越多运动爱好者选择加压运动防护绷带来提升安全性和表现力。本篇从需求出发,深入解读脚踝膝盖防护绷带的挑选与使用之道,帮你做出理性选择,享受运动乐趣。

满10卷送2卷!这种加压运动护具真的适合你吗?2026健身新潮流(满就送卷)

湖南华夏特变取得母排夹持机构及送电车专利,油缸支架不易发生变形(湖南华夏特变有限公司)

国家知识产权局信息显示,湖南华夏特变股份有限公司取得一项名为“一种母排夹持机构及送电车”的专利,授权公告号CN223858567U,申请日期为2024年12月。通过天眼查大数据分析,湖南华夏特变股份有限公司共…

湖南华夏特变取得母排夹持机构及送电车专利,油缸支架不易发生变形(湖南华夏特变有限公司)

一种巨伤眼的行为,很多人最近都在做!(伤眼的十大行为)

2023年一项对32名嫁接睫毛的人群研究发现,在嫁接睫毛1小时后,84.44%的人均报告出现眼部不适,其中最常见的异物感占到59.38%。这些症状可能在使用假睫毛后几小时或几天才会出现,产生的主要原因就是…

一种巨伤眼的行为,很多人最近都在做!(伤眼的十大行为)