Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

npu 相关 PR

2026-06-06

#26356 [NPU]Support torch_npu profiler patch API drift

原始 PR · 作者 L4-1024 · 合并时间 2026-06-06 21:27

缺陷修复 重要性 7.20 洞察度 4.00

新增 torch_npu 补丁 API 兼容层并更新调用方

建议 NPU 相关开发者阅读,该 PR 展示了如何平滑处理上游库的 API 漂移,并提供了可复用的兼容函数。单元测试覆盖了三种场景,值得参考。

文档 重要性 4.08 洞察度 2.00

更新 NPU 文档与 CI/Docker 配置以支持软件版本升级

该 PR 属于常规文档和配置更新,无需要重点关注的技术决策。NPU 相关开发者和用户可阅读了解最新版本要求。

2026-06-05
文档 重要性 3.81 洞察度 2.00

更新 Qwen3-Next-80B-A3B 的 NPU 最佳实践文档

该 PR 内容清晰,文档质量较好,推荐用户参考其中的配置部署 Qwen3-Next-80B-A3B 模型。后续可关注 `SGLANG_ENABLE_TP_MEMORY_INBALANCE_CHECK` 拼写是否修正,避免用户误用。

#27032 [NPU] add GLM model best practice docs

原始 PR · 作者 Hide-on-bushsh · 合并时间 2026-06-05 14:27

文档 重要性 5.23 洞察度 3.00

新增 GLM 模型 NPU 最佳实践文档,修复链接和路径

对于在 Ascend NPU 上部署 GLM 模型的用户,本 PR 提供的文档具有直接参考价值。对于文档维护者,可以关注 review 中对锚点 slug 化处理和硬编码路径替换的讨论,作为文档编写最佳实践。建议合并后对锚点链接进行自动化校验,防止未来因渲染规则变化导致失效。

#27335 6-5 nightly failed test case fix

原始 PR · 作者 liuxianglong17 · 合并时间 2026-06-05 11:39

缺陷修复 重要性 3.49 洞察度 2.00

修复 Ascend NPU 夜间测试超时和 warning 问题

该 PR 为常规维护性修复,无深度技术洞察,可快速合并。

文档 重要性 5.12 洞察度 2.00

同步遗留文档至 Mintlify 站点

本 PR 为纯文档同步操作,技术复杂度低,但具有重要的维护意义。建议所有文档贡献者阅读此 PR 的 commits 列表以了解如何确保文档一致性。值得关注的决策:被跳过的 PR 清单和原因(避免回退更新的内容)。

2026-06-04
缺陷修复 重要性 3.86 洞察度 3.00

修复 NPU 夜间测试失败问题

该 PR 为常规维护性修复,无需精读。但可关注 `test_ascend_utils.py` 中权重路径和环境变量的管理方式,作为测试基础设施维护的参考。

测试 重要性 3.27 洞察度 2.00

NPU 测试超时修复:watchdog-timeout 从 300 提升到 900

该 PR 属于应急性质的小幅参数调整,不值得精读。但可作为测试基础设施维护的参考:对于超时类失败,适当放宽阈值是快速稳定 CI 的手段之一。建议同时记录权重加载预期时间,并考虑后续优化加载速度以从根本上消除超时风险。