智算多多
官方邮箱:service@zsdodo.com

公司地址:北京市丰台区南四环西路188号总部基地三区国联股份数字经济总部


京公网安备11010602202532号 在上周的I/O 2026大会上,Gemini应用切换到了基于计算量的使用限制模式。针对用户反馈“限制触发过快”的问题,Google今天宣布了一些调整措施。
新的“计算量消耗”方式采用5小时刷新机制,直到达到周限额为止,这种方法会考虑提示词的复杂程度、使用的工具以及对话长度。Google上周指出,“简单的文本提示消耗的计算量远少于复杂的视频或编程提示”。未来,Google将允许Gemini应用用户购买按需付费的AI积分充值服务。
Gemini负责人Josh Woodward今天分享,在使用Gemini 3.1 Pro时,Google正在“限制单个提示可使用的配额上限,让用户能从Pro模型中获得更多使用次数”。这是为了应对包含大文件的复杂提示快速耗尽限额的问题。
Google澄清,错误请求不会计入限额:“如果请求失败,不会扣除配额。系统错误由我们承担,不是用户的责任。配额仅在成功完成时才会被使用。”
深度研究等重度任务“需要更多计算资源”,因此Google将提供“更详细的使用量明细和通知,帮助用户最大化利用限额”。目前,gemini.google.com/usage仪表板仅提供概览信息。
此外,3.1 Flash-Lite提示现在“免费且不计入配额”。Google还指出:
当用户选择特定模型时,系统会在所有后续会话中记住该选择。只有在用户手动调整或触发上限导致自动降级到轻量模型时才会改变。
最后,Google修复了一个漏洞,该漏洞导致“某些用户仅生成一两个Omni视频”就会耗尽配额。Google AI Ultra用户现在的Omni生成次数已翻倍。
我们已修复此问题,并将继续寻找机会增加Omni的使用量。
Gemini采用基于计算量的使用限制模式,会根据提示词的复杂程度、使用的工具和对话长度来计算消耗。简单文本提示消耗的计算量远少于复杂的视频或编程提示。系统采用5小时刷新机制,直到达到周限额。
不会。Google明确表示,如果请求失败不会扣除配额。系统错误由Google承担,用户的配额仅在请求成功完成时才会被使用。
Google做了多项调整:限制单个提示的配额上限以增加使用次数;3.1 Flash-Lite提示现在免费且不计入配额;修复了Omni视频快速耗尽配额的漏洞;Ultra用户的Omni生成次数翻倍;未来还将提供更详细的使用量明细和按需付费的AI积分充值服务。
