Prhub

sgl-project/sglang · 标签视图

标签列表

聚合结果

documentation 相关 PR

2026-06-06
文档 重要性 4.08 洞察度 2.00

更新 NPU 文档与 CI/Docker 配置以支持软件版本升级

该 PR 属于常规文档和配置更新,无需要重点关注的技术决策。NPU 相关开发者和用户可阅读了解最新版本要求。

功能 重要性 9.00 洞察度 5.00

新增 Apertus2509 工具调用与推理块解析器

该 PR 设计思路清晰,遵循了现有解析器框架的扩展模式,是添加新模型格式的良好范例。建议阅读 `apertus2509_detector.py` 和 `reasoning_parser.py` 的源码,了解如何集成 tool call 与 reasoning 解析。对于需要支持相似自定义格式的开发者,该 PR 提供了可复用的模式。

文档 重要性 7.02 洞察度 5.00

在cookbook中更新Xeon CPU支持信息

建议阅读该 PR,特别是 `disabledWhen` 和 `condition()` 的设计模式,展示了如何优雅地组织硬件依赖的 UI 选项。同时注意交叉检查多个模型页面的一致性,确保命令参数的准确性。

#27396 Cookbook for QAT

原始 PR · 作者 kpham-sgl · 合并时间 2026-06-06 02:18

文档 重要性 4.08 洞察度 2.00

为 Gemma 4 部署交互文档新增 QAT 检查点支持

建议合入。这是一个低风险、高收益的文档更新,通过交互式组件降低了用户使用 QAT 检查点的门槛,符合 SGLang 持续丰富模型部署指南的方向。

2026-06-05
文档 重要性 3.81 洞察度 2.00

更新 Qwen3-Next-80B-A3B 的 NPU 最佳实践文档

该 PR 内容清晰,文档质量较好,推荐用户参考其中的配置部署 Qwen3-Next-80B-A3B 模型。后续可关注 `SGLANG_ENABLE_TP_MEMORY_INBALANCE_CHECK` 拼写是否修正,避免用户误用。

#27032 [NPU] add GLM model best practice docs

原始 PR · 作者 Hide-on-bushsh · 合并时间 2026-06-05 14:27

文档 重要性 5.23 洞察度 3.00

新增 GLM 模型 NPU 最佳实践文档,修复链接和路径

对于在 Ascend NPU 上部署 GLM 模型的用户,本 PR 提供的文档具有直接参考价值。对于文档维护者,可以关注 review 中对锚点 slug 化处理和硬编码路径替换的讨论,作为文档编写最佳实践。建议合并后对锚点链接进行自动化校验,防止未来因渲染规则变化导致失效。

文档 重要性 5.12 洞察度 2.00

同步遗留文档至 Mintlify 站点

本 PR 为纯文档同步操作,技术复杂度低,但具有重要的维护意义。建议所有文档贡献者阅读此 PR 的 commits 列表以了解如何确保文档一致性。值得关注的决策:被跳过的 PR 清单和原因(避免回退更新的内容)。