#21162 [CI][NPU] Fix git report dubious ownership
作者 iforgetmyname · 合并时间 2026-03-23 14:36
修复 NPU CI 中 git 安全检查导致的失败问题。
此 PR 变更简单,建议快速浏览以了解 CI 配置修复方法,无需深入代码分析。对于负责 CI 维护的工程师,可参考此修复处理类似 git 安全检查问题。
SGLang is a high-performance serving framework for large language models and multimodal models.
作者 iforgetmyname · 合并时间 2026-03-23 14:36
修复 NPU CI 中 git 安全检查导致的失败问题。
此 PR 变更简单,建议快速浏览以了解 CI 配置修复方法,无需深入代码分析。对于负责 CI 维护的工程师,可参考此修复处理类似 git 安全检查问题。
作者 kpham-sgl · 合并时间 2026-03-23 14:35
将 Ngram 推测解码参数从 branch-length 重命名为 max-trie-depth,作为重构系列的一部分。
对于参与 Ngram 重构或维护推测解码功能的开发者,建议浏览此 PR 以了解参数名称变更,但变更相对机械,无需深入分析设计决策。关注点应放在确保所有文件更新一致,并检查是否有遗漏的重命名。
作者 ch-wan · 合并时间 2026-03-23 14:28
撤销 PR #19804 对 PPMissingLayer 的 bugfix,可能重新引入 AttributeError。
对于关注 PP 层实现或错误处理机制的工程师值得简要查看,但变更简单,重点在于理解 revert 的原因并监控潜在问题。建议结合 PR #19804 分析以了解上下文。
作者 xiezhq-hermann · 合并时间 2026-03-23 14:09
引入 HiSparse 机制,通过 CPU 内存存储空闲 KV 缓存,提升稀疏注意力模型的批大小和吞吐量。
建议技术管理者和工程师精读此 PR,重点关注 `HiSparseCoordinator` 的设计决策和 CUDA 内核的优化技巧。值得学习的包括高效的 GPU-CPU 缓存交换机制和 JIT 内核集成模式。对于部署,需验证配置兼容性并考虑添加测试覆盖。
作者 alisonshao · 合并时间 2026-03-23 13:41
修复 CI 中 cutlass 导入错误,恢复 nvidia-cutlass-dsl 强制重新安装。
这是一个简单的 CI bugfix,工程师可以快速浏览以了解 pip 依赖升级时的常见陷阱(如 .pth 文件问题),但无需深入分析。建议关注点在于 CI 脚本的依赖管理实践,但无重大设计决策值得精读。
作者 merrymercy · 合并时间 2026-03-23 13:33
启用ROCm上JIT内核支持,优化clamp_position和resolve_future_token_ids性能。
建议快速阅读以了解设备支持扩展的模式,特别是TensorMatcher设备选项的更新和Python入口点条件逻辑的简化设计;对于关注多平台支持的工程师,可注意未采纳的重命名建议,以改进代码可读性。
作者 yhyang201 · 合并时间 2026-03-23 12:15
在diffusion测试中自动跳过缺少所需pipeline类的测试,提升CI稳定性。
该PR变更较小,工程师可快速浏览以理解CI优化逻辑,但无需深入分析代码细节。值得关注的是review中关于错误处理精确性的讨论,对于设计稳健的测试框架和异常处理机制有借鉴意义。
作者 ShangmingCai · 合并时间 2026-03-23 12:13
临时禁用 CI 中不稳定的 Qwen3-30B 上下文并行测试。
该 PR 变更简单,主要用于 CI 维护,不值得精读;但如需了解 CI 测试禁用机制,可关注 `register_cuda_ci` 函数的用法。
参与讨论