#24174 ci: temporarily disable multimodal-gen-test-1-b200
原始 PR · 作者 alisonshao · 合并时间 2026-05-01 07:16
临时禁用 CI 中断言失败的多模态任务
该 PR 是一个典型的短期 CI 修复措施,内容简单直接。建议阅读者确认后续 tokenizer 修复后及时恢复该任务,避免长期测试覆盖缺失。设计决策亮点在于使用 `if: false` 而非完全移除 job,保留了任务定义和恢复路径。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 alisonshao · 合并时间 2026-05-01 07:16
临时禁用 CI 中断言失败的多模态任务
该 PR 是一个典型的短期 CI 修复措施,内容简单直接。建议阅读者确认后续 tokenizer 修复后及时恢复该任务,避免长期测试覆盖缺失。设计决策亮点在于使用 `if: false` 而非完全移除 job,保留了任务定义和恢复路径。
原始 PR · 作者 roopaksrivastav · 合并时间 2026-05-01 07:14
Mamba 测试与内核设备无关化以支持 XPU
值得关注 `get_device`、`get_device_count` 等辅助函数的设计模式,可作为后续设备无关化重构的参考。
原始 PR · 作者 kalyank007 · 合并时间 2026-05-01 07:13
替换硬编码 CUDA 设备为 get_device() 以支持 XPU
建议精读。虽然变更本身简单,但它展示了在大型项目中如何逐步引入设备抽象模式。重点关注 `llama.py` 中的条件分支和 `expert_distribution.py` 中通过 `get_device()` 抽象张量设备的方式,这对于未来支持更多硬件(如 NPU、AMD GPU)有参考价值。
原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-01 07:11
回退 rebase-required CI 检测模式
该 PR 是纯粹的回退操作,变更简单直接。建议关注回退后的 CI 稳定性,以及是否有替代方案来满足原始需求(要求 PR rebase)。如果不需要该功能,可以放心合入。
原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-05-01 07:09
nightly wheel 同时注册 cu129 和 cu130
建议合入。改动简洁、风险低,且提升了用户便利性。值得关注的是 `update_nightly_whl_index.py` 中错误处理的改进(从静默失败到显式抛出),这种模式值得在其他 CI 脚本中推广。
原始 PR · 作者 alisonshao · 合并时间 2026-05-01 06:57
回退B200 CI测试拆分,合并为单一套件
该 PR 为常规的 CI 清理操作,值得关注的是 B200 runner 资源管理策略的演进。对于 CI 维护者,该变更合理且必要;对于一般开发者,无需深入阅读。
原始 PR · 作者 alisonshao · 合并时间 2026-05-01 06:47
新增 rebase-required CI 检测模式
建议精读 `action.yml` 中的 shell 实现,了解 fail-open 设计、SHA 校验和 compare API 的使用。对于 CI 基础设施维护者有参考价值。
原始 PR · 作者 lawrence-harmonic · 合并时间 2026-05-01 06:40
修复 TboAttnBackend 中 HybridLinearAttnBackend 的崩溃
该 PR 修复明确,代码简洁,值得合并。建议维护者关注 `mrope_positions` 的维度兼容性,并考虑补充直接覆盖该路径的测试。
参与讨论