优化 multimodal CI 路径过滤,跳过文档文件变更,减少不必要测试运行。
建议 CI 维护者和涉及 CI 配置的工程师精读此 PR,以了解 `dorny/paths-filter` 中路径过滤模式的正确使用方法。关注 extglob 模式 `*.!(md|ipynb)` 的设计决策,它平衡了灵活性和简洁性。
SGLang is a high-performance serving framework for large language models and multimodal models.
优化 multimodal CI 路径过滤,跳过文档文件变更,减少不必要测试运行。
建议 CI 维护者和涉及 CI 配置的工程师精读此 PR,以了解 `dorny/paths-filter` 中路径过滤模式的正确使用方法。关注 extglob 模式 `*.!(md|ipynb)` 的设计决策,它平衡了灵活性和简洁性。
原始 PR · 作者 michaelzhang-ai · 合并时间 2026-03-25 05:04
为AMD MI325 runner添加4-GPU CI测试套件,包括per-commit和nightly测试。
该PR值得精读,特别是对于负责CI和测试的工程师,可以学习AMD/NVIDIA路径隔离的设计模式,以及如何通过条件逻辑(如is_in_amd_ci())和注册系统(register_amd_ci())维护多平台兼容性。
添加Lychee文档链接检查至本地和CI,提升文档可靠性并修复broken链接。
建议技术管理者关注CI工作流设计中的权衡(如离线vs在线检查),工程师可精读lychee配置文件和夜间工作流,学习如何平衡检查频率与开发者体验。
为MoE(混合专家)层添加LoRA(低秩适应)支持,并启用张量并行性(TP)以提升模型适应性。
建议技术管理者和工程师精读此PR,重点关注FusedMoEWithLoRA的设计如何融合LoRA增量(与vLLM保持一致),以及review中讨论的shape bug修复和测试策略。同时,注意未来扩展计划(TP>1、csgmv后端)以规划后续开发。
原始 PR · 作者 CloudRipple · 合并时间 2026-03-25 02:28
为MOVA-360p视频生成模型添加CI测试,覆盖单GPU和双GPU配置。
该PR值得快速浏览以了解新模型集成到测试套件的模式。重点关注如何重用现有sampling_params避免冗余定义,以及测试用例中不同并行配置(如tp_size、ring_degree)的设计,这对理解扩散模型测试框架有参考价值。
原始 PR · 作者 yctseng0211 · 合并时间 2026-03-25 01:41
修复AMD夜间测试中的Transformers 5.3.0不兼容性和gemma2-27b KV缓存问题。
该PR值得快速浏览,特别是对于负责CI维护和模型兼容性处理的工程师。关注grok.py中配置获取的健壮性模式,可作为处理类似库升级问题的参考,而aiter_backend.py的None检查展示了防御性编程在核心路径中的应用。
原始 PR · 作者 e-martirosian · 合并时间 2026-03-24 21:18
为Hunyuan3D扩散管道添加NPU支持,使模型能在Ascend NPU上运行。
建议技术管理者关注此PR中的设备抽象设计以及未来向NPU原生光栅化的演进计划;工程师可精读 __init__.py 文件,了解条件编译和设备处理模式,并注意数据类型转换可能带来的精度影响。
原始 PR · 作者 shadowxz109 · 合并时间 2026-03-24 20:57
为 Minimax2.5 模型适配 w2 量化层后缀,重构 MoE 量化方案检测逻辑。
建议对量化模块或 MoE 模型感兴趣的工程师精读此 PR,关注 get_moe_scheme 函数的重构设计,学习如何灵活处理多种量化配置后缀,同时注意风险分析中的边缘情况。
参与讨论