#37923 [Bugfix] Force continuous usage stats when CLI override is enabled

原始 PR 作者 dsingal0 合并时间 2026-03-25 01:29 文件变更 3 提交数 3 评论 0 代码增减 +41 / -17

执行摘要

修复 CLI 强制使用统计标志未启用连续使用统计的 bug。

根据PR body，动机是确保--enable-force-include-usage服务器级覆盖始终启用最终使用统计和连续使用统计，修复了原有逻辑中连续使用统计可能被stream options禁用的bug。PR body明确指出“make --enable-force-include-usage return (True, True) from should_include_usage()”以解决此问题。

建议快速浏览以理解修复逻辑，特别是should_include_usage()函数的变更。对于负责entrypoints模块或前端测试的工程师，值得关注回归测试的设计，以确保覆盖所有相关场景。

讨论亮点

Review讨论较少，仅gemini-code-assist[bot]评论确认变更正确解决了bug，并指出逻辑更清晰。simon-mo批准了PR，无其他评论。无争议点或深度技术讨论，变更被快速接受。

实现拆解

实现分为三个部分：首先，在vllm/entrypoints/utils.py中修改should_include_usage()函数，当enable_force_include_usage为True时直接返回(True, True)，简化了条件逻辑。其次，在tests/entrypoints/test_utils.py中添加参数化回归测试test_should_include_usage_force_enables_continuous_usage，覆盖多种stream options场景以验证强制覆盖行为。最后，更新tests/entrypoints/openai/chat_completion/test_enable_force_include_usage.py中的测试断言，移除不再适用的检查以匹配新逻辑。

文件	模块	状态	重要度
`vllm/entrypoints/utils.py`	entrypoints	modified	7.0
`tests/entrypoints/test_utils.py`	测试	modified	5.0
`tests/entrypoints/openai/chat_completion/test_enable_force_include_usage.py`	测试	modified	3.0

关键符号

should_include_usage

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

CLI 强制使用统计的正确性修复 正确性

gemini-code-assist[bot] 评论确认变更正确解决了 bug，并指出逻辑更清晰。

结论：变更被批准，无争议，确保强制覆盖始终启用连续使用统计。 · 已解决

风险与影响

风险较低，因为变更范围小且有测试覆盖。主要风险是修改了核心函数should_include_usage()，如果early return逻辑错误，可能影响其他stream options的处理，但测试覆盖了多种情况（如stream_options为None或包含不同设置）。此外，无兼容性问题，因为此变更旨在修复现有bug，不影响正确行为。

影响范围有限，主要影响使用--enable-force-include-usage CLI标志的用户，确保他们获得正确的连续使用统计。对系统其他部分无影响，属于前端行为修复。影响程度较小，仅涉及entrypoints模块中的使用统计逻辑。

核心逻辑变更

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

该PR修复了--enable-force-include-usage CLI标志未正确启用连续使用统计的bug，通过修改should_include_usage()函数逻辑并添加回归测试，确保服务器级覆盖始终包括连续使用统计，影响范围仅限于前端使用统计功能。

功能与动机

动机是确保当服务器启用--enable-force-include-usage标志时，响应中始终包含最终使用统计和连续使用统计，修复了原有逻辑中连续使用统计可能被stream options禁用的错误。PR body明确指出“make --enable-force-include-usage return (True, True) from should_include_usage()”以解决此问题，无需外部issue驱动。

实现拆解

核心逻辑变更：在vllm/entrypoints/utils.py中，should_include_usage()函数现在当enable_force_include_usage为True时直接返回(True, True)，简化了条件判断。
```
if enable_force_include_usage:
    return True, True
```
测试覆盖：在tests/entrypoints/test_utils.py中添加了参数化测试test_should_include_usage_force_enables_continuous_usage，验证在不同stream options（如None、include_usage=False等）下强制覆盖的行为。
测试更新：更新了tests/entrypoints/openai/chat_completion/test_enable_force_include_usage.py中的断言，移除assert chunk.usage is None以匹配新逻辑，确保测试通过。

评论区精华

Review讨论较少，仅gemini-code-assist[bot]确认“The changes are sound and effectively resolve the issue.”，simon-mo批准无评论。无技术争议或深度讨论，变更被快速接受。

风险与影响

风险：变更范围小，风险低。主要风险是修改了核心函数should_include_usage()，如果early return逻辑错误，可能影响其他stream options处理，但测试覆盖了多种场景，降低了回归风险。
影响：仅影响使用--enable-force-include-usage标志的用户，确保连续使用统计正确启用，对系统其他部分无影响，属于前端行为修复。

关联脉络

PR body提及#24477添加token-details字段到连续使用统计，但本PR专注于CLI覆盖语义变更，无直接技术关联。在同仓库近期历史PR中，类似bugfix PR如#37911修复前端警告，但未修改相同文件，无其他跨PR关联脉络。

#37923 [Bugfix] Force continuous usage stats when CLI override is enabled

执行摘要

修复 CLI 强制使用统计标志未启用连续使用统计的 bug。

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论