Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-18 18:16 同步状态:空闲 下次计划:2026-04-18 19:16

PR 列表

已合并 957 · 已分析 957
更多筛选
2026-04-17

#22955 [Diffusion] Fix ModelOpt B200 CI artifact coverage

作者 BBuf · 合并时间 2026-04-17 23:33

缺陷修复 重要性 6.89 洞察度 5.00

修复 ModelOpt B200 diffusion CI 覆盖,优化权重文件选择和 artifact 保存。

建议工程团队精读 `transformer_load_utils.py` 中的 `_prefer_mixed_safetensors_files` 函数,理解其设计权衡:在遇到混合和非混合文件共存时,优先选择混合版本以避免重复张量名问题。同时,关注测试 artifact 保存机制,确保在 CI 中正确配置环境变量以利用此功能。

#23076 [diffusion] CI: fix auto-partition

作者 mickqian · 合并时间 2026-04-17 22:37

基础设施 重要性 5.44 洞察度 4.00

修复扩散模型 CI 自动分区逻辑,支持多配置文件并防止空套件。

对于负责 CI 基础设施或扩散测试的工程师,建议精读以了解动态配置解析的设计。关注 `resolve_case_config_path` 函数和 `validate_suite_case_coverage` 验证逻辑,这些是防止 CI 回归的关键设计决策。

基础设施 重要性 5.72 洞察度 4.00

为 AMD CI 新增内网 Docker registry 镜像和 LAN 优先拉取策略,解决 Docker Hub rate limit 问题。

该 PR 值得运维和 CI 工程师精读,重点关注镜像拉取策略的设计决策(如优先级顺序和重试逻辑),以及硬编码 IP 和代码重复等可维护性改进点。

#22974 [AMD] fix AMD CI gate

作者 yctseng0211 · 合并时间 2026-04-17 18:32

基础设施 重要性 4.70 洞察度 3.00

修复 AMD CI 门控逻辑,确保调度/全量测试模式下所有子测试都能执行。

此 PR 主要面向 CI 维护者和 AMD 平台开发者。建议关注 `.github/workflows/pr-test-amd.yml` 中 `sgl-kernel-unit-test-amd` 作业的条件逻辑和 `run` 步骤的变更,理解其如何通过 `CONTINUE_ON_ERROR` 环境变量区分 PR 模式与调度/全量模式。对于一般开发者,无需深入研读。

缺陷修复 重要性 4.38 洞察度 3.00

为LoRA嵌入层暴露num_embeddings属性,修复多模态模型加载失败问题。

该PR值得快速浏览以理解LoRA包装类的属性暴露模式。虽然改动简单,但展示了在包装器类中保持与基础层接口一致性的重要设计原则。对于从事LoRA或多模态模块开发的工程师,可关注`VocabParallelEmbeddingWithLoRA`类中关于TP并行和input_scattered模式的注释,这些涉及更复杂的分布式计算约束。

测试 重要性 6.60 洞察度 4.00

新增流水线并行与混合分块预填充的GSM8K精度测试,验证功能兼容性。

该PR值得快速浏览,重点关注`TestPPMixedChunk`测试类的设计,它展示了如何为特定配置组合(PP+混合分块)添加端到端精度测试。对于涉及流水线并行或预填充优化的开发者,这个测试可作为参考模板。

基础设施 重要性 3.18 洞察度 2.00

将 NPU Dockerfile 中的 SGLang 安装方式从常规 pip 安装改为可编辑安装。

该 PR 变更简单明确,属于基础设施优化。对于不直接参与 NPU 平台 Docker 镜像构建或调试的工程师,无需精读。关注点在于理解可编辑安装(`-e`)模式在容器化调试场景下的应用价值。

#23052 [diffusion] doc: update doc

作者 mickqian · 合并时间 2026-04-17 16:23

文档 重要性 3.86 洞察度 3.00

更新扩散模型文档,新增API示例、环境变量和平台支持信息。

建议工程师和用户阅读更新后的文档,以了解扩散功能的新API、配置选项和平台支持,重点关注API示例和环境变量部分。

参与讨论