#21385 [Diffusion] Refactor diffusion JIT kernel test layout and narrow CI triggers
作者 BBuf · 合并时间 2026-03-26 15:02
重构扩散JIT内核测试布局并收窄CI触发范围。
建议关注此PR以了解扩散JIT内核测试的组织优化和CI触发策略,特别是对于从事测试基础设施或CI配置的工程师,值得精读 `test/run_suite.py` 和CI工作流文件的变更,但整体变更较直接,可快速浏览。
SGLang is a high-performance serving framework for large language models and multimodal models.
作者 BBuf · 合并时间 2026-03-26 15:02
重构扩散JIT内核测试布局并收窄CI触发范围。
建议关注此PR以了解扩散JIT内核测试的组织优化和CI触发策略,特别是对于从事测试基础设施或CI配置的工程师,值得精读 `test/run_suite.py` 和CI工作流文件的变更,但整体变更较直接,可快速浏览。
作者 hnyls2002 · 合并时间 2026-03-26 14:57
增强killall.py脚本的诊断能力,添加PID命名空间检查和进程列表输出以解决CI中GPU内存清理失败问题。
建议涉及CI管理或容器环境调试的工程师精读此PR,关注其PID命名空间检查、进程匹配和日志结构的设计决策,这些对类似共享GPU容器的调试有借鉴价值。
作者 hnyls2002 · 合并时间 2026-03-26 14:28
简化CI检查动作并添加维护门控到rerun-ut,减少样板代码。
对于CI维护者或对基础设施改进感兴趣的工程师,建议浏览以了解简化模式;对于一般开发者,变更简单,无需深入关注。
作者 yafengio · 合并时间 2026-03-26 12:01
为Kimi K2.5模型添加EPLB负载均衡所需的routed_experts_weights_of_layer属性,修复AttributeError。
该PR变更简单直接,是典型的缺失属性修复。对于关注Kimi模型支持或EPLB负载均衡机制的工程师,可快速浏览以了解模型类如何暴露专家权重信息。无需深入分析代码逻辑。
作者 froststeam · 合并时间 2026-03-26 12:00
为xgrammar后端的apply_vocab_mask添加MUSA设备支持,扩展硬件兼容性。
这是一个简单的功能扩展PR,变更直接且风险低。建议工程师快速阅读以了解设备支持扩展模式,特别是如何更新设备检查逻辑。对于关注多硬件兼容性的开发者,可以借鉴此PR的代码重构方式(使用集合提高可读性),但无深层次设计决策需要精读。
作者 yafengio · 合并时间 2026-03-26 12:00
为 MUSA 平台启用分片 CUDA 图支持,扩展硬件兼容性。
该 PR 值得精读,特别是对于涉及 MUSA 平台或 CUDA 图优化的开发者。关注设计决策如硬件检测逻辑的扩展(通过 is_musa() 函数)和弱引用张量操作的跨平台注册模式,这体现了框架在异构硬件支持上的技术权衡。
作者 yeahdongcn · 合并时间 2026-03-26 11:59
添加 StreamContext stub 修复 MPS 后端启动崩溃问题。
该 PR 变更简单,设计直白,适合快速浏览以了解 MPS 兼容性修复。对于深入理解存根模式或设备抽象层有参考价值。
作者 yeahdongcn · 合并时间 2026-03-26 11:59
添加MPS环境检查类以修复check_env脚本在Apple Silicon上的失败。
建议精读此PR以学习如何在SGLang中添加新硬件环境检查模块;特别关注错误处理的设计决策和review中讨论的改进点,这对于编写健壮的跨平台代码具有参考价值。
参与讨论