#44442 [Minor] Remove FlashInfer version check in topk_topp_sampler
原始 PR · 作者 WoosukKwon · 合并时间 2026-06-04 05:06
移除 FlashInfer 版本检查
可以快速合并。这是一个干净的清理 PR,适合作为审查培训的简单案例。
标签列表
聚合结果
原始 PR · 作者 WoosukKwon · 合并时间 2026-06-04 05:06
移除 FlashInfer 版本检查
可以快速合并。这是一个干净的清理 PR,适合作为审查培训的简单案例。
原始 PR · 作者 yewentao256 · 合并时间 2026-06-04 03:22
融合residual支持到batch-invariant RMS norm
值得精读,特别是关于批处理不变性归一化的设计模式。合并函数并支持可选residual的做法简洁清晰,可作为类似重构的参考。
原始 PR · 作者 yewentao256 · 合并时间 2026-06-04 02:22
移除 FPQuant 中的死代码
建议合并,属于常规代码清理,无技术风险,有助于保持代码库整洁。
修复负值 max_num_scheduled_tokens 绕过验证的 bug
这是一个清晰的低风险修复,值得合并。虽为微小改动,但体现了配置验证一致性的好实践——避免将验证逻辑分散在条件分支中。建议在类似场景(如 `max_num_seqs` 等字段)也应用相同模式。
原始 PR · 作者 NickLucche · 合并时间 2026-06-04 00:04
CI 测试移除显式 HMA 标记,对齐默认启用
可安全合并。建议后续关注 HMA 功能演进,确保 CI 持续对齐。
抑制工具解析器中 ast.literal_eval 的 SyntaxWarning
推荐默认合并。这是一次低风险、高收益的清理操作,能改善 Python 3.12+ 用户的日志可读性,且逻辑简单。
原始 PR · 作者 shen-shanshan · 合并时间 2026-06-03 16:21
更新 ViT CUDA 图文档,同步代码变更
此 PR 是纯粹的文档同步更新,对大多数工程师无需精读。但若您正在使用或开发 ViT CUDA 图系统,建议查看此文档以了解最新的 API 和流程。
为 FS Tier Manager 添加跨进程共享文档
此 PR 为小范围文档改进,理解价值有限。但其中关于 `PYTHONHASHSEED` 的说明对于理解 vLLM 跨实例 KV 缓存共享机制有参考意义。