Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 13:37 同步状态：空闲下次计划：2026-06-07 14:37

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-21

#22940 [HiCache]Fix hybrid model move_indices

原始 PR · 作者 huangtingwei9988 · 合并时间 2026-04-21 15:15

缺陷修复重要性 7.10 洞察度 5.00

修复HiCache混合模型中move_indices的错误，防止非法内存访问。

该PR值得精读，特别是`move_hybrid_indices`和`_record_transfer_indices_on_stream`的实现，展示了缓存索引移动和stream记录的最佳实践。关注设计决策中如何统一处理普通与hybrid pool，以及接口重构的权衡。

hicachebugfixkv-cache

#23337 [Docs] Sync docs_new with legacy docs and update migration redirects

原始 PR · 作者 zijiexia · 合并时间 2026-04-21 15:15

文档重要性 7.35 洞察度 4.00

同步新旧文档并更新迁移重定向，添加pre-commit保护遗留目录。

建议技术管理者关注重定向规则的可靠性和pre-commit钩子的实施，以确保文档迁移顺利进行。工程师可参考新增的扩散模型和硬件平台支持文档，了解最新开发指南，并学习pre-commit机制以规范贡献流程。

documentationrun-ci

#23044 [XPU] Fix DeepSeek-OCR tests under transformers 5.x

原始 PR · 作者 JustinTong0323 · 合并时间 2026-04-21 14:57

缺陷修复重要性 4.31 洞察度 5.00

修复XPU平台DeepSeek-OCR测试在transformers 5.x下的导入错误。

该PR值得快速浏览，以了解transformers版本升级导致的兼容性问题及团队内的解决方案（通过get_tokenizer统一管理tokenizer加载）。关注点在于sglang.srt.utils.hf_transformers.get_tokenizer的设计，它封装了兼容性处理，可作为类似问题的标准做法。

deepseekrun-citest

#23263 [ROCm] Uniform docker to support AMD AINIC, BRCM Thor2 IBGDA NIC for MoRI-EP

原始 PR · 作者 kkHuang-amd · 合并时间 2026-04-21 14:39

基础设施重要性 4.40 洞察度 5.00

更新AMD ROCm Docker镜像以支持Broadcom Thor2 NIC驱动和自动检测。

建议精读以了解AMD平台Docker镜像中NIC驱动的集成设计和自动检测机制。关注`docker/rocm.Dockerfile`中的case语句如何统一管理多种NIC后端，这对于基础设施团队在类似场景下的设计有参考价值。

amdrun-cidocker

#20816 [Diffusion][CPU] Init CPU platform support for SGLang Diffusion

原始 PR · 作者 jianan-gu · 合并时间 2026-04-21 14:25

功能重要性 9.00 洞察度 5.00

为SGLang Diffusion添加原生CPU平台支持，实现纯CPU推理和优化绑定。

该PR值得精读，特别是关注CPUWorker继承设计和共享内存通信优化，这些设计决策展示了如何扩展平台支持并保持代码一致性。

diffusioncpujit-kernel

#23209 [Refactor] Move radix-cache utils onto RadixKey as methods

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-21 14:11

重构重要性 8.13 洞察度 5.00

将基数树缓存的工具函数重构为RadixKey类方法，提升代码封装性和一致性。

建议仔细阅读`radix_cache.py`中新增的`RadixKey`方法实现，特别是`match`方法中的bigram处理逻辑。这展示了如何将复杂的分支逻辑封装到类方法中，值得学习其设计权衡。对于涉及缓存系统的开发者，此PR是理解代码库演进的重要参考。

refactorkv-cacherun-ci

#23315 Opt-in strip of thinking tokens from radix cache

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-21 13:59

功能重要性 6.46 洞察度 6.00

为推理模型添加可选的基数树缓存思考令牌剥离功能，以节省GPU内存。

建议精读此PR，特别关注`_cache_commit_len()`的设计决策和opt-in策略，它展示了如何在最小化变更下处理推理模型特有的缓存问题，代码改动集中且测试全面，是学习缓存优化和向后兼容性权衡的好例子。

kv-cacheperformancefeature

#22544 [Score API] Add Multi-Item Scoring with pre-computed delimiter indices

原始 PR · 作者 fortunecookiee · 合并时间 2026-04-21 13:50

功能重要性 8.68 洞察度 7.00

引入预计算分隔符索引的Multi-Item Scoring优化，消除GPU扫描提升性能。

建议技术管理者和工程师精读此PR，重点关注： 1. 预计算索引的数据流设计如何消除GPU扫描，可作为高性能计算中减少同步的案例。 2. `pool_at_delimiter_positions`函数实现展示了如何批量处理变长索引并优化设备传输。 3. 讨论中的权衡决策，如边界处理、性能优化取舍，对类似优化有参考价值。

featureperformancerun-ci

第 229 / 357 页 · 共 2853 条

上一页 1 … 227 228 229 230 231 … 357 下一页