Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 16:47 同步状态:空闲 下次计划:2026-06-07 17:47

PR 列表

更多筛选
2026-03-26

#21420 Revert "[Bugfix] Disable ci for .md files"

原始 PR · 作者 Fridge003 · 合并时间 2026-03-26 03:00

基础设施 重要性 3.00 洞察度 2.00

撤销禁止CI对.md文件触发的变更,恢复原工作流路径过滤规则。

这是一个简单的revert操作,无需深入精读。对于关注CI配置的工程师,可了解路径过滤规则的演变,并监控后续CI行为是否稳定。

#21410 [Bugfix] Disable ci for .md files

原始 PR · 作者 OrangeRedeng · 合并时间 2026-03-26 01:19

缺陷修复 重要性 4.00 洞察度 2.00

修复CI工作流中.md文件触发测试的bug,避免不必要的CI运行。

这是一个简单的CI配置修复,建议快速审核以确保路径过滤规则正确,无需深入代码学习;对CI维护者和基础设施团队有价值,可关注类似PR #21334以理解CI优化趋势。

文档 重要性 2.00 洞察度 1.00

更新生成模型文档,添加 NVIDIA Nemotron 3 Super 和 Nano 4B 模型条目。

对于技术管理者,此 PR 不值得深度阅读,只需确认文档更新及时。工程师可快速浏览 `generative_models.md` 文件以了解新增模型信息,无复杂技术决策需关注。

2026-03-25
性能优化 重要性 6.00 洞察度 6.00

优化Qwen select01 Triton调制内核,提升扩散模型去噪性能约2.8%。

该PR值得精读,特别是对于从事Triton内核优化或扩散模型性能调优的工程师。关注指针选择减少冗余加载的设计决策,以及启动参数调优的经验,这些技巧可应用于其他高性能计算场景。

基础设施 重要性 6.00 洞察度 6.00

在nightly CI中添加扩散模型跨框架性能比较job,自动化追踪性能趋势。

推荐技术管理者和工程师精读此PR,重点关注scripts/ci/utils/diffusion/run_comparison.py中的服务器生命周期管理、性能数据收集逻辑,以及仪表板生成的设计决策。这提供了构建可扩展CI性能监控管道的实用模式,值得学习其异常处理、依赖管理和可视化集成。

#21323 [Diffusion] Add AKO4ALL kernel optimization skill

原始 PR · 作者 BBuf · 合并时间 2026-03-25 18:46

文档 重要性 5.00 洞察度 4.00

为SGLang扩散内核优化添加基于AKO4ALL的技能文档和前置脚本,标准化调优工作流程。

对于内核优化工程师和文档维护者,此PR值得精读,以了解AKO4ALL调优流程的设计决策: - **关注点**:SKILL.md中的工作流程设计,特别是强制预检和验证门,可借鉴其结构化工序;脚本的假设问题提醒了在自动化工具中考虑用户环境多样性的重要性。 - **建议**:在实际使用前,验证脚本在本地环境的行为,并根据review建议检查脚本实现;对于新加入的工程师,此文档可作为快速上手指南。

性能优化 重要性 6.00 洞察度 6.00

为高内存GPU(≥130 GiB)自动跳过Wan/MOVA DiT层级卸载,优化延迟。

该PR值得精读,特别是关注基于硬件特性的性能优化启发式设计。建议工程师学习如何通过基准测试数据校准阈值,并考虑在类似场景中应用类似策略。

#21022 [Chore] Clean up JIT compilation flags

原始 PR · 作者 DarkSharpness · 合并时间 2026-03-25 18:08

重构 重要性 5.00 洞察度 6.00

重构 JIT 编译标志管理,统一 CUDA 架构信息处理。

建议技术管理者和工程师精读此 PR,重点关注 ArchInfo 设计决策和上下文管理器模式,以借鉴到类似编译优化场景,尤其是 JIT 内核开发中的架构管理。

参与讨论