#21410 [Bugfix] Disable ci for .md files
作者 OrangeRedeng · 合并时间 2026-03-26 01:19
修复CI工作流中.md文件触发测试的bug,避免不必要的CI运行。
这是一个简单的CI配置修复,建议快速审核以确保路径过滤规则正确,无需深入代码学习;对CI维护者和基础设施团队有价值,可关注类似PR #21334以理解CI优化趋势。
SGLang is a high-performance serving framework for large language models and multimodal models.
作者 OrangeRedeng · 合并时间 2026-03-26 01:19
修复CI工作流中.md文件触发测试的bug,避免不必要的CI运行。
这是一个简单的CI配置修复,建议快速审核以确保路径过滤规则正确,无需深入代码学习;对CI维护者和基础设施团队有价值,可关注类似PR #21334以理解CI优化趋势。
作者 Naveassaf · 合并时间 2026-03-26 00:03
更新生成模型文档,添加 NVIDIA Nemotron 3 Super 和 Nano 4B 模型条目。
对于技术管理者,此 PR 不值得深度阅读,只需确认文档更新及时。工程师可快速浏览 `generative_models.md` 文件以了解新增模型信息,无复杂技术决策需关注。
作者 BBuf · 合并时间 2026-03-25 20:48
优化Qwen select01 Triton调制内核,提升扩散模型去噪性能约2.8%。
该PR值得精读,特别是对于从事Triton内核优化或扩散模型性能调优的工程师。关注指针选择减少冗余加载的设计决策,以及启动参数调优的经验,这些技巧可应用于其他高性能计算场景。
作者 mickqian · 合并时间 2026-03-25 19:01
在nightly CI中添加扩散模型跨框架性能比较job,自动化追踪性能趋势。
推荐技术管理者和工程师精读此PR,重点关注scripts/ci/utils/diffusion/run_comparison.py中的服务器生命周期管理、性能数据收集逻辑,以及仪表板生成的设计决策。这提供了构建可扩展CI性能监控管道的实用模式,值得学习其异常处理、依赖管理和可视化集成。
作者 BBuf · 合并时间 2026-03-25 18:46
为SGLang扩散内核优化添加基于AKO4ALL的技能文档和前置脚本,标准化调优工作流程。
对于内核优化工程师和文档维护者,此PR值得精读,以了解AKO4ALL调优流程的设计决策: - **关注点**:SKILL.md中的工作流程设计,特别是强制预检和验证门,可借鉴其结构化工序;脚本的假设问题提醒了在自动化工具中考虑用户环境多样性的重要性。 - **建议**:在实际使用前,验证脚本在本地环境的行为,并根据review建议检查脚本实现;对于新加入的工程师,此文档可作为快速上手指南。
作者 BBuf · 合并时间 2026-03-25 18:45
为高内存GPU(≥130 GiB)自动跳过Wan/MOVA DiT层级卸载,优化延迟。
该PR值得精读,特别是关注基于硬件特性的性能优化启发式设计。建议工程师学习如何通过基准测试数据校准阈值,并考虑在类似场景中应用类似策略。
作者 DarkSharpness · 合并时间 2026-03-25 18:08
重构 JIT 编译标志管理,统一 CUDA 架构信息处理。
建议技术管理者和工程师精读此 PR,重点关注 ArchInfo 设计决策和上下文管理器模式,以借鉴到类似编译优化场景,尤其是 JIT 内核开发中的架构管理。
作者 hnyls2002 · 合并时间 2026-03-25 17:16
为GPU清理验证添加重试循环,减少CI不稳定失败。
建议CI维护人员精读此PR,了解重试机制的设计,特别是如何处理GPU内存检查和进程清理的协同。同时,注意代码重复问题,可作为未来重构的参考点。
参与讨论