Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-07 11:28 同步状态：空闲下次计划：2026-06-07 12:28

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-05-28

#26494 Remove DeepGEMM for indexer GEMM in piecewise NSA path

原始 PR · 作者 b8zhong · 合并时间 2026-05-28 15:15

重构重要性 5.00 洞察度 4.00

移除 NSA 分段路径中冗余的 DeepGEMM 依赖

该 PR 改动简洁且正面，值得合并。代码风格清晰，注释充分。建议阅读者关注 `torch.mm` 的 `out_dtype` 用法，这是 PyTorch 2.10 的新特性。

refactorperformancedeepseek

#26022 Group ScheduleBatch and ForwardBatch fields by data-flow role

原始 PR · 作者 hnyls2002 · 合并时间 2026-05-28 15:11

重构重要性 7.38 洞察度 3.00

按数据流角色重组批量数据结构字段声明

建议所有涉及推理调度和模型执行的开发者快速浏览此 PR，以了解 `ScheduleBatch` 和 `ForwardBatch` 的新分组约定。该约定有助于在后续开发中保持字段组织一致性，避免随意添加字段。

refactorschedulingdocumentation

#25486 Use Cute-DSL MXFP8 quantize kernels

原始 PR · 作者 b8zhong · 合并时间 2026-05-28 15:01

性能优化重要性 6.05 洞察度 4.00

MXFP8量化启用Cute-DSL后端，SM100加速

该PR变更小、风险低，但为Blackwell GPU带来了重要的性能优化，建议合并并跟踪后续性能基准数据。

performancequantblackwell

#26193 Add a little env var for disabling Flashinfer autotune cache

原始 PR · 作者 b8zhong · 合并时间 2026-05-28 14:59

功能重要性 5.57 洞察度 3.00

新增 FlashInfer 自调优缓存开关环境变量

推荐合并。代码简洁、逻辑清晰，无回归风险。该功能为开发者工具，默认不影响生产。可进一步考虑增加单元测试验证环境变量的行为。

featuredebuggingdocumentation

#26433 fix(tool_call): reland schema type normalization

原始 PR · 作者 JustinTong0323 · 合并时间 2026-05-28 14:31

缺陷修复重要性 8.50 洞察度 4.00

恢复并改进工具参数 JSON Schema 类型归一化

此 PR 解决了工具模式验证中的一个实际兼容性问题，值得合并。建议关注后续可能出现的边缘类型处理请求。

bugfixrefactortest

#26544 [AMD] Fix aiter checkout (rocm dockerfile)

原始 PR · 作者 bingxche · 合并时间 2026-05-28 14:25

缺陷修复重要性 3.14 洞察度 3.00

修复 ROCm Dockerfile 中 AITER git checkout 失败

建议快速合并。这是一个清晰的 Docker 构建修复，根因定位准确，改动量极小。

amdbugfixdocker

#26487 feat: convert mm_hashes to str in encode_server for Mooncake key compat

原始 PR · 作者 QiuMike · 合并时间 2026-05-28 14:16

缺陷修复重要性 5.67 洞察度 3.00

修复 hash 类型不匹配导致 Mooncake 缓存失效

该 PR 是典型的接口类型不匹配 bugfix，逻辑简单直接，适合快速合入。建议阅读以了解多模态缓存与 Mooncake 的集成点。

bugfixhicache

#26535 [AMD] force AITER checkout to bypass CSV CRLF/LF smudge dirty state

原始 PR · 作者 yctseng0211 · 合并时间 2026-05-28 14:05

缺陷修复重要性 3.14 洞察度 3.00

修复 AMD AITER 检出失败问题

值得合并，修复明确、风险低。但建议关注 AITER 上游是否彻底迁移 CSV 到 LF，届时可恢复为普通 checkout 以保留额外安全保护。

bugfixamdinfra

第 58 / 357 页 · 共 2850 条

上一页 1 … 56 57 58 59 60 … 357 下一页