#21192 Fix CP in-seq-split method for DeepSeek V32 and update related tests
作者 Fridge003 · 合并时间 2026-03-24 03:34
修复 DeepSeek V3.2 上下文并行中 in-seq-split 方法的计算错误并标准化测试。
建议工程师精读 server_args.py 的修改,了解上下文并行计算逻辑;测试重构部分可作为测试迁移的参考。
SGLang is a high-performance serving framework for large language models and multimodal models.
作者 Fridge003 · 合并时间 2026-03-24 03:34
修复 DeepSeek V3.2 上下文并行中 in-seq-split 方法的计算错误并标准化测试。
建议工程师精读 server_args.py 的修改,了解上下文并行计算逻辑;测试重构部分可作为测试迁移的参考。
作者 merrymercy · 合并时间 2026-03-24 01:48
改进 CI 和测试文档,提供清晰指导并修复相关测试文件。
该 PR 值得快速浏览,特别是 test/README.md 的更新,对于理解项目 CI 结构和测试指南有直接帮助。代码变更部分如 sys.exit 修复和路径调整值得关注,可检查类似问题在其他地方是否已解决。对于技术管理者,可参考文档改进作为最佳实践。
作者 yichiche · 合并时间 2026-03-24 01:21
为AMD平台添加GemmaRMSNorm的fused HIP前向方法,提升Qwen3.5模型性能。
建议精读此PR以学习AMD平台上的性能优化策略,关注forward_hip方法中的kernel路由设计、回退机制和Gemma特定偏移处理,这些是设计决策的核心。对于从事硬件后端优化的工程师,此PR提供了融合kernel集成的实际案例。
作者 vaibhawvipul · 合并时间 2026-03-24 00:33
为srt/constrained模块添加单元测试,提升测试覆盖率至54%。
建议工程师精读test_grammar_manager.py中的并发测试部分,学习如何模拟Future和状态隔离;关注design决策如缓存机制和错误处理,这些在测试中得到充分验证。
作者 jiabinwa · 合并时间 2026-03-24 00:30
新增srt/observability模块单元测试,覆盖所有子模块,提升代码质量。
对于技术管理者和工程师,建议关注测试中使用的stub模式和mock策略,这些是处理复杂依赖的实用技术。PR值得精读以学习如何为observability模块编写高效单元测试,并了解stub drift风险的管理方法。
作者 Zijun9 · 合并时间 2026-03-24 00:26
为 srt/parser 模块新增 306 个单元测试,实现接近 100% 的覆盖率。
这是一个高质量的测试 PR,值得工程师精读以学习如何为解析器模块编写全面的单元测试,特别是使用真实对象和覆盖边缘情况的设计,以及 review 中关于测试隔离和注释维护的实践。
作者 Johnsonms · 合并时间 2026-03-23 23:17
修复JIT RMSNorm中对hidden_size {64,128,256}的静默失败,并改进错误处理。
建议技术管理者将此PR作为JIT内核扩展和性能优化的典型案例,工程师可精读`rmsnorm_warp` kernel设计和性能基准比较,学习如何平衡代码可读性与性能,并关注错误处理改进以提高用户体验。
作者 yuan-luo · 合并时间 2026-03-23 23:17
优化Qwen3.5 GDN投影层,通过Triton核融合操作减少内核启动和内存分配。
该PR值得精读,特别关注Triton核的设计实现、权重加载器的兼容性处理,以及性能优化策略。工程师可从中学习内核融合技术和量化模型适配方法。
参与讨论