国产免费69成人精品视频,国产亚洲欧美一区,99国产成人高清在线视频

谷歌Gemini 2.5 API新推隱式緩存功能，開發者成本有望大幅削減

發布時間：2025-05-10 12:10 來源：ITBEAR 作者：柳晴雪

近期，科技界傳來一則新動態，谷歌在其Gemini 2.5 API中引入了名為“隱式緩存”的新功能，旨在通過智能化手段降低開發者的成本。據科技媒體WinBuzzer于5月9日報道，這一創新技術能自動識別并重用API請求中的常見前綴，從而幫助開發者實現成本的大幅縮減，最高可達75%。

具體而言，“隱式緩存”功能適用于Gemini 2.5系列中的Pro和Flash模型。該功能無需開發者進行任何手動配置，系統默認啟用，大大簡化了操作流程。它通過自動檢測并重用API請求中的重復前綴，有效提升了效率，降低了成本。

值得注意的是，“隱式緩存”與谷歌早前在2024年5月推出的“顯式緩存”有所不同。后者需要開發者自行配置，而前者則完全由系統自動處理，不僅節省了成本，還顯著提升了用戶體驗。為了最大化隱式緩存的效果，谷歌建議開發者在構建提示詞時，將穩定且常見的內容置于開頭，隨后再添加用戶特定的變量內容。

谷歌還指出，如果開發者在短時間內發送具有相似前綴的請求，將有助于提高緩存的命中率，進一步提升效率。不過，為了享受這一功能，開發者需要滿足一定的Token數量要求：Gemini 2.5 Flash模型需至少1024個Token，而Gemini 2.5 Pro模型則需至少2048個Token。

為了幫助開發者更好地了解緩存的使用情況，谷歌在API響應中新增了“cached_content_token_count”字段。這一字段將顯示緩存Token的使用詳情以及優惠計費信息，讓開發者能夠清晰掌握成本節約的具體情況。

盡管谷歌宣稱“隱式緩存”功能能夠帶來高達75%的成本節省，但實際效果仍需第三方進行驗證。同時，由于不同開發者的使用模式可能存在差異，因此具體節省的幅度也可能有所不同。

谷歌并未完全放棄“顯式緩存”方案。作為可選方案，顯式緩存仍然支持Gemini 2.5及2.0模型，并允許開發者自定義緩存內容和生存時間（TTL，默認1小時）。這一靈活性使得開發者能夠根據自身需求選擇最適合的緩存方案。

更多>同類內容

午夜日韩久久影院,亚洲欧美在线观看首页,国产情侣真实露脸在线最新,一级毛片在线观看免费