修复SGLang Diffusion文档导航链接、移除侧边栏重复项并优化兼容性表格。
该PR值得文档维护者或新用户快速浏览,以了解SGLang Diffusion文档的结构改进。关注点在于如何通过配置文件和内容更新修复常见文档问题,但无需深入技术细节。
SGLang is a high-performance serving framework for large language models and multimodal models.
修复SGLang Diffusion文档导航链接、移除侧边栏重复项并优化兼容性表格。
该PR值得文档维护者或新用户快速浏览,以了解SGLang Diffusion文档的结构改进。关注点在于如何通过配置文件和内容更新修复常见文档问题,但无需深入技术细节。
原始 PR · 作者 kkHuang-amd · 合并时间 2026-04-22 07:45
修复 ROCm Dockerfile 中语法错误,移除多余 `&&` 确保构建成功。
该 PR 非常简短,**无需精读**。对于关注 AMD 平台基础设施或 Docker 构建的工程师,可以快速浏览 `docker/rocm.Dockerfile` 的变更以了解常见的 Dockerfile 语法陷阱。没有复杂的设计决策值得深入研究。
原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-22 05:42
支持返回路由专家数据时使用重叠调度,提升 MoE 模型推理吞吐量。
建议工程师精读此 PR,重点关注 `RoutedExpertsOutput` 类的设计,它通过分离复制和完成操作,实现了高效的重叠调度模式,这种模式在性能优化中值得借鉴。同时,注意配置 `disable_overlap_schedule` 的影响,以最大化性能收益。
原始 PR · 作者 wisclmy0611 · 合并时间 2026-04-22 05:35
为文档站点添加 SpecForge 外部重定向并更新代码所有者。
此 PR 变更简单直接,主要用于文档基础设施维护。对于核心开发者和架构师,无需深入阅读。值得关注的点是:1) 项目文档采用了集中式 JSON 配置管理重定向,模式清晰;2) 团队持续通过 CODEOWNERS 精细化管理代码所有权。
为 bench_one_batch_server 添加 LoRA 和多批处理支持
对于从事 LoRA 性能基准测试的工程师,该 PR 值得精读。其中关于多批处理模式的设计(跳过 max_running_requests 检查、重新计算 token_capacity)以及 LoRA 请求分布策略(uniform/distinct/skewed)是值得关注的决策。
更新文档站点中 Google、Qwen、Wan 和 Zimage 的 logo 图片。
该 PR 无需精读。对于工程师而言,可以完全跳过,除非您专门负责文档站点的视觉资产维护。
为 Kimi-K2.6 模型文档添加 MMMU Pro 数据集评估细节和结果。
此 PR 变更简单直接,主要为文档内容同步。对于一般开发者,无需精读;对于需要了解 Kimi-K2.6 模型具体评测结果或配置细节的用户,可快速浏览更新部分以获取参考信息。无复杂的设计决策需要关注。
修复 cache_salt 隔离失效的 extra_key 传递 bug
该 PR 是典型的数据传递断裂 bug,代码改动量小但影响面大——直接破坏安全特性。推荐精读以理解 SGLang 请求处理链中 Req 构造的关键节点,建议未来类似 feature 在 PR 中增加端到端集成测试。
参与讨论