Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 11:28 同步状态：空闲下次计划：2026-06-07 12:28

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-11

#22565 chore: update CI test est_time values

原始 PR · 作者 sglang-bot · 合并时间 2026-04-11 09:15

基础设施重要性 4.00 洞察度 2.00

自动化更新250个CI测试文件的估计时间值，优化负载均衡算法准确性。

该PR无需精读，除非您负责CI基础设施、测试调度优化或关注自动化流程。可快速浏览以了解est_time更新机制，但无重要设计决策需深入分析。

cirun-ci

#22563 fix: match est_time updates by backend, not just suite

原始 PR · 作者 ch-wan · 合并时间 2026-04-11 08:54

缺陷修复重要性 3.00 洞察度 4.00

修复CI测试时间估算脚本，按后端硬件区分时间统计，避免跨后端数据污染。

该PR虽小但展示了CI基础设施中一个重要的数据隔离问题。建议精读以理解：1) 如何通过数据结构设计避免数据污染；2) 正则表达式在配置更新中的精确匹配技巧。对于负责CI维护的工程师，这是值得参考的修复模式。

bugfixcirun-ci

#22560 [Diffusion][CI] Fix nunchaku unit test broken by #22365

原始 PR · 作者 alisonshao · 合并时间 2026-04-11 08:49

缺陷修复重要性 3.00 洞察度 2.00

修复因#22365引入的扩散模型单元测试失败，通过Mock下载函数避免本地路径被误识别为HF仓库。

该PR变更简单，无需精读。对于关注扩散模型量化加载逻辑或CI测试稳定性的工程师，可快速浏览以了解Mock用法和测试修复模式。

diffusionquanttest

#22557 fix: track est_time per suite instead of per backend

原始 PR · 作者 ch-wan · 合并时间 2026-04-11 07:58

基础设施重要性 4.00 洞察度 3.00

修复CI测试时间估算脚本，按测试套件而非后端硬件区分时间统计。

该PR值得CI/基础设施维护者精读，展示了如何从CI日志中提取和关联元数据以优化资源调度。关注点：1. job_name_to_suite函数的设计如何平衡灵活性与鲁棒性。2. 从backend到suite的键变更如何影响时间数据聚合粒度。

cirun-ci

#22555 [mem] Fix idle token_usage missing mamba_usage; add FIXME for naming

原始 PR · 作者 hnyls2002 · 合并时间 2026-04-11 07:20

缺陷修复重要性 4.00 洞察度 3.00

修复空闲路径下token_usage统计缺失Mamba使用量的问题，并添加字段命名澄清注释。

该PR值得快速浏览，重点关注：1) 修复逻辑如何确保混合SSM场景下统计一致性。2) FIXME注释揭示的字段命名技术债务，可作为未来API设计参考。对于深入理解内存管理或Mamba集成的工程师有参考价值。

bugfixrun-cimamba

#20310 [tokenizer] improve non streaming request processing + some small fixes.

原始 PR · 作者 alexnails · 合并时间 2026-04-11 06:46

重构重要性 6.00 洞察度 6.00

为非流式请求引入文本缓冲机制，避免O(N²)字符串拼接并修复相关逻辑。

建议技术管理者和核心工程师精读此 PR，重点关注： 1. `ReqState` 中 buffer_text 的设计决策，这是避免 O(N²) 拼接的关键。 2. Review 中关于 `stream_output` 与 `incremental_streaming_output` 区别的讨论，有助于理解 SGLang 流式输出配置的设计哲学。 3. 性能优化技巧，如 kwargs 比较优化和 batch_decode 的 zip 合并。 4. 留意作者提到的 `stream-output+stream` 性能回归问题，可能需后续跟踪。

refactorperformancerun-ci

#22461 [CI] Add GB200 nightly perf regression pipeline

原始 PR · 作者 csahithi · 合并时间 2026-04-11 06:12

基础设施重要性 6.00 洞察度 5.00

新增GB200集群夜间性能回归测试管道，监控DeepSeek-R1推理基准。

该PR主要涉及CI基础设施，值得团队负责CI的工程师精读，以学习Slurm集成和自动化测试设计。对于核心开发人员，关注配置管理和结果处理部分，但变更对核心代码无直接影响。

ciperformancerun-ci

#22545 feat: add weekly workflow to update CI test est_time values

原始 PR · 作者 ch-wan · 合并时间 2026-04-11 06:03

基础设施重要性 6.00 洞察度 6.00

添加每周工作流自动化更新CI测试估计时间，优化负载均衡。

该PR值得精读，特别是脚本中的日志解析、中位数计算和正则表达式更新逻辑，这些设计决策展示了CI自动化的最佳实践；建议关注GitHub API集成和错误处理部分，以了解如何稳健处理外部数据源。

cirun-ci

第 269 / 357 页 · 共 2850 条

上一页 1 … 267 268 269 270 271 … 357 下一页

sgl-project/sglang

PR 列表

#22565 chore: update CI test est_time values

#22563 fix: match est_time updates by backend, not just suite

#22560 [Diffusion][CI] Fix nunchaku unit test broken by #22365

#22557 fix: track est_time per suite instead of per backend

#22555 [mem] Fix idle token_usage missing mamba_usage; add FIXME for naming

#20310 [tokenizer] improve non streaming request processing + some small fixes.

#22461 [CI] Add GB200 nightly perf regression pipeline

#22545 feat: add weekly workflow to update CI test est_time values

参与讨论