Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 14:40 同步状态：空闲下次计划：2026-06-07 15:40

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-01

#21241 [bugfix] Fix rope theta config for MiniMax after transformers v5 update

原始 PR · 作者 trevor-m · 合并时间 2026-04-01 02:37

缺陷修复重要性 4.00 洞察度 3.00

修复 MiniMax 模型的 RoPE 配置，以兼容 transformers v5 更新。

建议快速 review，关注配置迁移的完整性和 `get_rope_config` 函数的正确性。对于涉及 transformers 升级的项目，此 PR 展示了如何处理库更新带来的配置不兼容问题，值得参考类似场景。

bugfixconsistency

#21518 [AMD] Fix Handle missing rope_theta in get_rope_config for Grok-1

原始 PR · 作者 michaelzhang-ai · 合并时间 2026-04-01 01:58

缺陷修复重要性 5.00 洞察度 4.00

修复Grok-1模型加载因缺失rope_theta属性的崩溃，影响AMD INT4版本。

该PR值得快速浏览以理解如何处理HuggingFace配置中缺失属性的兼容性问题，但变更简单，无需深入分析。关注本地提取逻辑作为处理配置版本差异的示例。

bugfixamd

2026-03-31

#21750 [HiMambaTree]: Optimize mamba host lock mechanism

原始 PR · 作者 hzh0425 · 合并时间 2026-03-31 21:52

性能优化重要性 6.00 洞察度 6.00

优化 Mamba 主机锁机制，引入细粒度引用计数以独立管理内存。

建议精读此 PR，关注细粒度引用计数的设计决策，以及如何在严格性和灵活性之间权衡。对于缓存机制开发者，这是一个值得学习的内存管理优化案例。

performancerefactorconsistency

#21390 [diffusion] Fix Wan2.2-I2V-A14B video max size and calculate generated video size from the given width and height

原始 PR · 作者 yeahdongcn · 合并时间 2026-03-31 21:49

缺陷修复重要性 5.00 洞察度 5.00

修复Wan2.2-I2V-A14B视频分辨率过小问题，支持用户指定宽度和高度以计算输出尺寸。

建议技术管理者和工程师精读此PR，关注input_validation.py中处理用户尺寸的逻辑设计（如长宽比保持和面积限制），以及如何通过配置继承来管理不同模型的分辨率限制。此外，review中的讨论展示了API设计中的权衡（如width/height与size的覆盖关系）和向后兼容性考虑，值得学习。

bugfixdiffusionfeature

#21755 [diffusion] UX: replace deprecated ORJSONResponse with orjson_response

原始 PR · 作者 mickqian · 合并时间 2026-03-31 21:41

重构重要性 3.00 洞察度 3.00

替换已弃用的ORJSONResponse为项目内orjson_response，确保扩散模块HTTP响应的序列化一致性。

建议工程师在阅读此PR时，重点关注common_api.py的decorator是否应添加response_class以维持性能。此PR的其他部分为简单替换，适合快速扫描，无需深入分析。

diffusionrefactorconsistency

#17389 Fix remote weight info nnode>1 and dp>1

原始 PR · 作者 JD-ETH · 合并时间 2026-03-31 21:17

重构重要性 7.00 洞察度 7.00

重构远程权重加载引擎信息同步机制，解决多节点和DP>1场景下的失败问题。

建议技术管理者关注此PR的设计决策，特别是引导服务器模式在分布式信息同步中的借鉴价值；工程师应精读engine_info_bootstrap_server.py的实现和model_runner.py的注册逻辑，注意端口配置管理（如避免冲突）和测试用例以验证多节点/DP场景。

bugfixrefactortest

#21760 [PD] Tiny cleanup after KVReceiver refactor

原始 PR · 作者 ShangmingCai · 合并时间 2026-03-31 21:07

重构重要性 3.00 洞察度 3.00

清理KV接收器重构后的冗余代码，统一中止逻辑并调整重试次数。

建议工程团队精读common/conn.py中的abort方法实现，关注是否存在未处理的null检查风险；此PR展示了代码复用和清理的设计决策，适合快速浏览以理解统一错误处理模式。

refactorconsistencyscheduling

#21752 Fix kimi-linear launch server error

原始 PR · 作者 yuan-luo · 合并时间 2026-03-31 21:07