#25209 [AMD] Add amd jit clamp position bench ci
原始 PR · 作者 Emmanuel0612 · 合并时间 2026-05-14 15:03
新增 AMD CI benchmark 注册
建议合入。属于标准 CI 接入变更,代码简洁,已验证 AMD 环境通过。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 Emmanuel0612 · 合并时间 2026-05-14 15:03
新增 AMD CI benchmark 注册
建议合入。属于标准 CI 接入变更,代码简洁,已验证 AMD 环境通过。
原始 PR · 作者 AgainstEntropy · 合并时间 2026-05-14 15:02
修复 torchcodec 解析带尾部元数据 WAV 崩溃
建议合并。这是一次防御性编程改动,以极低代价提升了系统鲁棒性。可考虑后续补充单元测试,覆盖 torchcodec 抛出异常的场景。
原始 PR · 作者 yctseng0211 · 合并时间 2026-05-14 15:01
ROCm NSA indexer 自动回退 page_size=1 以兼容低版本 Triton
值得关注的设计包括:运行时能力检测与优雅降级模式;通过 `@lru_cache` 避免重复检测;使用独立环境变量提供紧急逃生通道(`SGLANG_NSA_HIP_DISABLE_PRESHUFFLE`);以及在 `server_args.py` 中用延迟导入打破循环依赖的技巧。
修复新式 register_cuda_ci 不被识别
建议合并后关注后续是否有遗漏的新式参数变体(如参数顺序不一致),可考虑未来将 `_extract_suite` 进一步抽象为更通用的参数解析器。此 PR 适合 CI/Infra 团队精读,对理解 CI 注册机制的演进有参考价值。
原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-05-14 14:47
避免不必要的 hidden states D2H 拷贝
建议精读,这是一个典型的小型性能优化案例,展示了如何通过传递控制参数避免不必要的 GPU-CPU 数据传输。
为 DSv4 文档添加 H100 部署选项和 Docker 镜像
建议快速合入。该 PR 是纯文档和数据展示层面的更新,逻辑清晰、改动集中,且已通过 review。对于文档类 PR 而言,这是一个规范的样例。
新增 Intra-Node NVLink 配置文档
简单的文档更新,值得阅读以了解新配置选项。
修复 NPU 上 Qwen2-VL 图像预处理与 GDN 闪退兼容性问题
建议阅读以了解 NPU 后端如何适配上游库变更,但该 PR 变更较小,团队可快速合并。后续应补充测试用例以确保预处理补丁的兼容性。
参与讨论