Repositories / sgl-project / sglang

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态：已开启最近同步：2026-06-13 17:27 同步状态：空闲下次计划：2026-06-13 18:27

PR 列表

最近 1 天最近 3 天最近 7 天

更多筛选

排序重要度开始结束

✕ 清空

标签聚合仓库周报

2026-04-21

#23038 [KDA] Fuse gate+cumsum and reuse chunk index for KDA

原始 PR · 作者 yuan-luo · 合并时间 2026-04-21 17:54

性能优化重要性 9.00 洞察度 6.00

融合KDA的gate+cumsum操作并重用chunk index，提升内核性能2.2-2.65倍和端到端吞吐量6-11%。

该PR值得精读，特别是`kda_gate_chunk_cumsum`内核的实现展示了如何通过融合计算减少内存往返，以及chunk index重用优化避免了重复预处理。关注设计权衡（如简化路径、测试覆盖）和性能提升技巧。

performancerefactorjit-kernel

#23186 [AMD] Fused qk rmsnorm bf16 for amd/Kimi-K2.5-MXFP4

原始 PR · 作者 akao-amd · 合并时间 2026-04-21 17:35

缺陷修复重要性 5.98 洞察度 4.00

修复AMD平台DeepSeek MLA BF16模型无法使用融合QK RMSNorm内核的问题。

该PR值得精读，重点关注条件判断的修正逻辑和融合内核的导入方式，这体现了硬件特定优化中条件分支的设计权衡。对于AMD平台开发或MLA注意力优化有参考价值。

amdperformancedeepseek

#22614 Fix: Add token heuristic increment in total_tokens load balancing

原始 PR · 作者 whybeyoung · 合并时间 2026-04-21 16:29

缺陷修复重要性 6.20 洞察度 5.00

修复 `total_tokens` 负载均衡中因缺少启发式 token 增量导致请求堆积的问题。

该 PR 值得精读，尤其是 `DPBudget.dispatch` 方法的修改，展示了如何在负载均衡中平衡启发式增量和快照校正的设计。关注 gemini-code-assist[bot] 提出的多模态 token 低估问题，这可能影响未来扩展。

bugfixschedulingrun-ci

#23221 Optimize LTX2 feed-forward tensor parallelism

原始 PR · 作者 BBuf · 合并时间 2026-04-21 16:29

性能优化重要性 6.08 洞察度 7.00

优化 LTX2 前馈网络张量并行，消除大尺寸 AllGather 通信提升推理速度。

该 PR 值得精读，重点关注张量并行中激活分片保持的设计决策，以及如何通过 ColumnParallelLinear(gather_output=False) 和 RowParallelLinear(input_is_parallel=True) 的组合消除大尺寸 AllGather。同时可学习其完整的性能验证方法，包括基准测试、内核分析和视觉质量检查。

diffusionperformancerun-ci

#23344 [Docs] Update installation and TPU documentation to fix the render problem

原始 PR · 作者 zijiexia · 合并时间 2026-04-21 16:12

文档重要性 2.87 洞察度 2.00

修复文档渲染问题，将安装和TPU文档中的可折叠区域从HTML标签迁移到自定义Accordion组件。

该PR属于纯粹的文档格式更新，不涉及任何技术实现。对于工程师和技术管理者，无需精读代码。值得关注的唯一设计决策是项目选择使用自定义的`<Accordion>`组件替代标准HTML标签，这反映了项目对文档系统一致性和可定制性的重视。

documentationrun-ci

#23348 docs: redirect /cookbook to /cookbook/intro

原始 PR · 作者 wisclmy0611 · 合并时间 2026-04-21 16:05

文档重要性 2.92 洞察度 1.00

为文档站点添加从 /cookbook 到 /cookbook/intro 的显式重定向。

此 PR 变更简单明确，**无需精读**。对于工程师而言，可以将其视为一次标准的文档配置维护。值得关注的点在于：这是对 Mintlify 文档生成器重定向机制的实际应用示例，展示了如何通过修改 `docs.json` 来修正路由问题。

documentationrun-ci

#23156 [AMD] prepare for MI300x PR runner pool: registry mirror, runner routing, threshold tuning

原始 PR · 作者 bingxche · 合并时间 2026-04-21 15:58

基础设施重要性 5.91 洞察度 5.00

为AMD CI准备MI300x PR运行器池，优化镜像拉取、动态路由并调整性能阈值。

该PR对于负责CI/CD基础设施和AMD平台支持的工程师非常值得精读。重点关注：1) 如何设计镜像拉取的回退和重试策略以提升鲁棒性；2) 如何利用GitHub Actions的表达式动态选择运行器环境；3) 大规模性能测试阈值调整的策略和具体数值，可作为硬件平台适配的参考案例。

run-ciamdperformance

#23338 [AMD] CI - Fix the cancelled guard to AMD CI

原始 PR · 作者 yctseng0211 · 合并时间 2026-04-21 15:45

基础设施重要性 3.32 洞察度 2.00

修复 AMD CI 工作流取消后任务卡住的问题，添加取消守卫。

这是一个简单的 CI 配置修复，无需深入阅读。对于关注 CI/CD 基础设施的工程师，可以快速浏览变更文件以了解 GitHub Actions 中 `always()` 和 `!cancelled()` 的使用模式。

amdrun-ci

第 267 / 396 页 · 共 3165 条

上一页 1 … 265 266 267 268 269 … 396 下一页