为GPU清理验证添加重试循环,减少CI不稳定失败。
建议CI维护人员精读此PR,了解重试机制的设计,特别是如何处理GPU内存检查和进程清理的协同。同时,注意代码重复问题,可作为未来重构的参考点。
SGLang is a high-performance serving framework for large language models and multimodal models.
为GPU清理验证添加重试循环,减少CI不稳定失败。
建议CI维护人员精读此PR,了解重试机制的设计,特别是如何处理GPU内存检查和进程清理的协同。同时,注意代码重复问题,可作为未来重构的参考点。
原始 PR · 作者 yctseng0211 · 合并时间 2026-03-25 16:10
修复Mistral模型格式检测误判,避免服务器崩溃。
该PR值得精读,以了解模型格式检测的微妙设计决策,特别是如何处理混合格式模型的兼容性问题。关注`_is_mistral_native_format`方法的改动,这揭示了在原生与HuggingFace格式之间权衡的实践。
整合SGLang Diffusion文档结构,优化用户导航并强调sgl-kernel使用。
对于技术管理者,无需深入代码审查,但可关注文档组织的改进思路以指导其他模块;对于工程师,建议浏览新结构以熟悉文档布局,特别是sgl-kernel的强调部分,但无需精读细节。
修复 HiCache 测试失败,将测试拆分为独立文件以优化 CI 执行。
对于技术管理者,此 PR 无需深入评审,可快速合并以稳定 CI。对于工程师,可作为测试文件重构的简单案例,但无关键技术洞察,不建议精读。建议关注类似 CI 修复 PR(如 #21305)以积累测试稳定性优化经验。
更新 Ascend NPU 平台文档,删除已弃用参数并添加新功能参数。
对于技术管理者和工程师,此 PR 值得快速浏览以了解文档更新内容,特别是新添加的参数和模型名称变更,但无需深入代码审查。建议关注 `ascend_npu_support_features.md` 中的新参数,确保在使用 Ascend NPU 功能时参考最新文档。
原始 PR · 作者 alisonshao · 合并时间 2026-03-25 14:54
重写 killall_sglang 为 Python 脚本,实现 GPU 范围限制的 CI 清理,避免跨容器进程误杀。
该 PR 值得精读,特别是其 GPU 隔离机制和双模式设计(CI 与本地),对优化多 GPU CI 环境有参考价值。关注关键函数如 _get_target_gpus 和 _kill_pids 的实现细节,以及内存检查逻辑,有助于理解如何处理跨容器资源冲突。
更新扩散模型量化文档,提供更清晰的使用指南。
对于技术管理者,此PR值得快速浏览以了解量化功能的更新;对于工程师,建议阅读新文档`quantization.md`以熟悉量化选项和使用方法,无需精读代码变更。
原始 PR · 作者 ShangmingCai · 合并时间 2026-03-25 14:28
更新 TestQwen35PPAccuracy 跳过条件以解决 H100 和 AMD 上的精度回归导致的 CI 阻塞。
建议快速浏览以了解 CI 稳定性维护的临时策略,重点关注跳过条件变更背后的权衡决策。
参与讨论