#21578 CI Dependency add libgl1-mesa-glx libgl1-mesa-dri
原始 PR · 作者 monkeyLoveding · 合并时间 2026-04-03 16:22
为 NPU CI 环境添加 OpenGL 依赖 libgl1-mesa-glx 和 libgl1-mesa-dri。
对于大多数开发者,此 PR 无需深入阅读,属于常规基础设施维护。若关注 NPU 或 CI 依赖管理,可简要查看变更文件。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 monkeyLoveding · 合并时间 2026-04-03 16:22
为 NPU CI 环境添加 OpenGL 依赖 libgl1-mesa-glx 和 libgl1-mesa-dri。
对于大多数开发者,此 PR 无需深入阅读,属于常规基础设施维护。若关注 NPU 或 CI 依赖管理,可简要查看变更文件。
原始 PR · 作者 michaelzhang-ai · 合并时间 2026-04-03 16:01
为 AMD MI30x 和 MI35x 添加 MiniMax-M2.5 模型的夜间性能基准测试。
对于关注 AMD 硬件性能测试和 CI 扩展的工程师,此 PR 值得精读以了解如何将性能基准测试集成到现有 CI 模式中,特别是 continue-on-error 策略和准确性与性能结合的设计决策。对于其他读者,可重点关注测试文件的结构和配置,以借鉴类似测试的编写方法。
为 AMD MI300/MI355 启用 FP8 KV 缓存和 FP8 注意力内核,提升 NSA 性能。
该 PR 值得精读,特别是关注 FP8 注意力内核的设计(如缩放常量处理和融合量化路径),以及如何针对不同硬件(MI300 vs MI355)优化缓存写入。建议工程師学习其性能优化技巧和 AMD 特定代码集成模式。
为 NPU 硬件优化 GLM4.7 模型性能,引入双流处理和融合内核。
建议技术管理者关注此 PR 中的流管理设计和内核融合策略,对 NPU 优化或高性能计算感兴趣的工程师值得精读,特别是 `glm4_moe.py` 中的条件分支和同步逻辑,以及 review 中讨论的正确性验证要点。
原始 PR · 作者 ShangmingCai · 合并时间 2026-04-03 15:13
将mooncake后端中可选staging字段移至类定义末尾,提升代码清晰度。
这是一个简单的代码清理PR,无需深入精读。对于关注mooncake后端或代码风格的开发者,可以快速浏览以了解字段顺序的最佳实践。
原始 PR · 作者 Ricardo-M-L · 合并时间 2026-04-03 15:05
修复四个文件注释中的重复单词,提升代码文档质量。
该PR不值得精读,除非您特别关注代码文档质量或相关模块的注释细节。对于工程师,可以快速浏览以了解团队对文档清理的重视;对于管理者,可作为代码质量持续改进的示例。无需深入分析设计决策,因为这是简单的文本修正。
修复 GitHub 工作流中重复作业名称,防止分支保护绕过。
建议技术管理者关注此 PR 作为 CI 最佳实践,特别是涉及分支保护的工作流设计。工程师可以精读 scripts/ci/check_workflow_job_names.py 脚本,学习如何通过预提交钩子自动化检查配置错误,并应用到其他类似场景。
原始 PR · 作者 zyzshishui · 合并时间 2026-04-03 14:43
修复ROCm/aiter后处理中权重替换丢失自定义属性问题,确保RL工作流正常。
建议精读unquant.py中的copy_or_rebind_param实现,理解其如何平衡原地更新与形状兼容;同时关注review中关于分片属性同步的讨论,这对分布式训练场景很重要。
参与讨论