Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 16:47 同步状态：空闲下次计划：2026-06-07 17:47

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-08

#21692 [Bugfix] [NPU] Qwen3.5 with quantization fix

原始 PR · 作者 OrangeRedeng · 合并时间 2026-04-08 14:15

缺陷修复重要性 5.00 洞察度 6.00

修复NPU平台上Qwen3.5量化模型因映射更新导致的失效问题。

建议技术管理者和工程师精读此PR，关注量化映射修复的设计决策（如参数命名统一和映射更新），以及review中关于向后兼容性的讨论，这些内容对理解量化模块的演进和维护有参考价值。

bugfixnpuquant

#21710 [AMD] Add GLM-5-FP8 nightly performance benchmarks for MI30x and MI35x

原始 PR · 作者 michaelzhang-ai · 合并时间 2026-04-08 13:43

测试重要性 5.00 洞察度 4.00

为AMD MI30x和MI35x平台新增GLM-5-FP8模型的夜间性能基准测试。

建议团队关注此PR以了解AMD性能测试框架的扩展，但需后续处理review中提出的代码质量问题，如重构重复函数和修复除零风险，以确保测试健壮性。

amdtestperformance

#22314 [AMD] Fix GLM-5 fp8 KV quant path dispatch on MI300

原始 PR · 作者 1am9trash · 合并时间 2026-04-08 12:16

缺陷修复重要性 5.00 洞察度 4.00

修复MI300平台上GLM-5 FP8 KV缓存量化路径错误分发问题。

该PR值得AMD平台开发者或关注量化路径的工程师精读。重点关注条件逻辑重构的设计决策：如何通过精确的条件组合（_is_hip、self.use_nsa、self.dtype == fp8_dtype）替代原有的笼统flag检查，这种模式在硬件特定优化中值得借鉴。同时注意review中关于常量导入和代码清理的最佳实践。

amdbugfixquant

#22298 [CI] Move manual-only nightly tests out of test/registered/

原始 PR · 作者 alisonshao · 合并时间 2026-04-08 12:03

基础设施重要性 3.00 洞察度 2.00

将三个手动夜间测试文件从注册目录移至手动目录，修复CI测试收集错误。

该PR值得快速浏览以了解CI测试目录结构规范，但不需深入分析代码逻辑。关注点在于理解test/registered/和test/manual/目录的区别：前者需要CI注册，后者用于手动执行。这对于维护CI测试套件的工程师有参考价值。

run-citest

#21502 [NPU] enable index Cache for npu

原始 PR · 作者 ChefWu551 · 合并时间 2026-04-08 11:45

功能重要性 6.00 洞察度 5.00

为NPU后端启用IndexCache支持，提升长上下文推理性能。

建议NPU后端开发者和对IndexCache优化感兴趣的工程师精读此PR。关注点包括：1. IndexCache在NPU上的集成模式，如何通过`skip_topk`和`next_skip_topk`控制索引传递。2. 性能数据背后的实际部署考量，如内存开销和并发影响。3. 与上游PR #21405的关联，以理解完整设计上下文。

npuperformancefeature

#22292 [CI] Fix stage-b-test-1-gpu-large (0) timeout by reordering LoRA tests and using tokenizer from cache

原始 PR · 作者 alexnails · 合并时间 2026-04-08 11:00

基础设施重要性 4.00 洞察度 5.00

通过重排测试顺序和优化tokenizer加载，修复CI单GPU大模型测试超时问题。

该PR值得CI/测试维护者精读，以了解如何优化测试顺序和资源加载来避免外部依赖延迟。关注点包括：`find_local_repo_dir`的使用方式、测试重命名的策略，以及从提交历史中反映的从延长超时到根本修复的决策过程。

run-citestrefactor

#22309 Use dedicated runner label for deepep 8-GPU tests

原始 PR · 作者 alisonshao · 合并时间 2026-04-08 10:58

基础设施重要性 3.00 洞察度 2.00

为DeepEP 8-GPU测试指定专用runner标签，隔离RDMA故障机器。

该PR变更简单，无需深入代码审查，但可作为CI环境隔离的参考案例。关注点：专用runner标签的维护策略和RDMA故障的根因缓解。

run-citest

#22304 [tiny] Fix TOCTOU race in pause-aware weight update locking

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-08 09:54

缺陷修复重要性 4.00 洞察度 5.00

修复暂停感知权重更新锁中的TOCTOU竞态条件，确保并发安全。

该PR值得精读，展示了并发编程中TOCTOU竞态的典型修复模式。关注点：1）如何在锁范围内保持状态一致性；2）条件锁与writer锁的协同使用；3）从死锁修复到竞态修复的演进。对于涉及暂停/恢复机制的开发者有参考价值。

bugfixrun-cirefactor

第 284 / 358 页 · 共 2857 条

上一页 1 … 282 283 284 285 286 … 358 下一页