AMD CI 注册 EAGLE 约束解码测试
该 PR 变更简单,但体现了跨平台 CI 覆盖的重要实践:为 AMD 专用 runner 添加上游已有 CUDA 测试时,应根据实际运行时长合理调整 `est_time` 以优化 CI 分区。可快速合入。
SGLang is a high-performance serving framework for large language models and multimodal models.
AMD CI 注册 EAGLE 约束解码测试
该 PR 变更简单,但体现了跨平台 CI 覆盖的重要实践:为 AMD 专用 runner 添加上游已有 CUDA 测试时,应根据实际运行时长合理调整 `est_time` 以优化 CI 分区。可快速合入。
原始 PR · 作者 michaelzhang-ai · 合并时间 2026-05-17 13:56
AMD CI 注册 5 个框架测试,缩小覆盖差距
本 PR 虽为 CI 配置变更,但其筛选策略和 Reviewer 反馈处理的思路值得关注:1)通过关键字过滤排除硬件相关测试,避免虚假失败;2)对于平台特有差异,使用 skipIf(is_hip()) 精确跳过,而非全局禁用;3)坚持注册的测试必须可运行,避免注册即禁用。推荐 CI 维护者和跨平台贡献者阅读。
内存感知组件加载排序防OOM
值得精读。PR 展示了如何在不改变加载语义的前提下,通过纯排序解决资源竞争问题,并妥善处理与 FSDP 的交互。可关注 `order_component_load_specs` 的“inferred size + risk rank”双重排序策略,以及 `is_fsdp_managed_module` 的抽取模式。
修复 DeepSeek V4 文档多处错误并新增 MegaMoE 说明
该 PR 为文档修复和功能补充,建议立即合并以修正已知问题并完善 MegaMoE 说明。值得关注的点:1) `isMegamoeUnsupported` 的设计与实际后端兼容性对齐;2) 文档格式审查流程。
降低 MoE inplace 设置日志级别并添加条件
建议合入,变更简单明确,无引入问题的风险。
调整 KL 散度测试阈值为 0.02
建议合并,但需要添加明确的动机说明(例如引用具体的 CI 失败链接或 KL 散度分布数据)。此外,删除冗余注释后代码更简洁。
原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-05-17 04:05
回退 workspace buffer 初始化重构,修复残缺 wrappers 问题
建议立即跟进修复 `init_mha_chunk_metadata` 中的 `AttributeError`,在调用父类前增加 `hasattr(self, 'mha_chunk_kv_cache')` 检查或条件保护。长期而言,可重新设计 workspace 初始化方案,兼顾子类复用与父类完整性,但需确保所有代码路径下 wrapper 初始化完备。
DSV4 部署文档清理环境变量,新增 MegaMoE 切换
建议阅读此 PR 的文件变更,了解 DSV4 部署配置的演进。特别关注如何通过前端配置实现后端功能选项的添加和清理。
参与讨论