#21089 Fix jit-kernel unit test CI dependency install in pr-test workflow
原始 PR · 作者 merrymercy · 合并时间 2026-03-22 13:13
修复pr-test工作流中JIT-kernel单元测试的依赖安装配置错误。
该PR变更简单直接,不建议深入阅读,除非您负责CI维护或遇到类似依赖安装问题。可快速浏览patch_excerpt确认配置调整,无需精读代码逻辑。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 merrymercy · 合并时间 2026-03-22 13:13
修复pr-test工作流中JIT-kernel单元测试的依赖安装配置错误。
该PR变更简单直接,不建议深入阅读,除非您负责CI维护或遇到类似依赖安装问题。可快速浏览patch_excerpt确认配置调整,无需精读代码逻辑。
原始 PR · 作者 alphabetc1 · 合并时间 2026-03-22 12:54
删除 utils/common.py 中的死代码,减少噪音并提升可维护性。
该 PR 变更简单直接,适合快速浏览以了解代码清理的最佳实践。对于新贡献者,可以学习如何识别和移除死代码;无需精读,除非关注代码维护流程。
原始 PR · 作者 merrymercy · 合并时间 2026-03-22 12:53
移除 PR 测试工作流中的临时 cron 作业 hack。
无需精读此 PR,变更简单明了。对于 CI 配置管理者,可关注以了解基础设施的维护实践,但无复杂设计决策值得学习。
原始 PR · 作者 OrangeRedeng · 合并时间 2026-03-20 20:54
将NPU扩散模型CI性能基线TextEncodingStage时间从301ms提升至1200ms,以解决CI测试偶发性超时失败。
该PR变更简单直接,适合快速浏览以了解CI基线调整策略。值得关注的是review中提出的关于性能测试方法论和根本原因分析的讨论,这对维护稳定的CI/CD流程有借鉴意义。
修复fp8_kernel中scale_step_k计算错误,确保缩放指针正确前进。
对于涉及fp8量化或内核开发的工程师,建议精读以理解共享参数管理的正确实现,尽管代码简单,但展示了在性能与正确性间的权衡决策。
原始 PR · 作者 AlfredYyong · 合并时间 2026-03-20 03:57
增强 Kimi-K2/K2.5 函数调用检测,修复推理块内工具调用标记泄漏并支持连字符函数名。
建议工程师精读此 PR,以学习推理解析与函数调用检测的设计权衡,特别是重用通用机制(PR #17714)的简化策略;关注 `kimik2_detector.py` 中的正则表达式更新和特殊令牌处理,以及测试文件中的场景覆盖,有助于理解边缘 case 防御。
原始 PR · 作者 JustinTong0323 · 合并时间 2026-03-19 04:50
升级 transformers 到 5.3.0,修复 v5 兼容性问题,涉及 95 个文件的大规模适配。
建议技术管理者和工程师精读此 PR,特别关注 rope 参数处理的统一方案(get_rope_config() 函数)和模型适配模式(如 Gemma3 嵌套结构处理)。对于类似大规模依赖升级,可以参考此次变更的协调方式和测试修复策略。
为W8A8 MoE解码阶段引入新NPU操作符以提升性能。
该PR值得精读,特别是对于关注NPU硬件优化和MoE模型性能的工程师。关键设计决策包括只优化decode阶段以避免prefill回归,以及使用融合操作符减少计算开销,这些权衡值得学习。
参与讨论