Prhub
← 返回仓库详情

标签聚合

sgl-project/sglang · 标签视图

标签列表

聚合结果

amd 相关 PR

2026-04-18

#22342 [AMD] Enable DFLASH speculative decoding on ROCm

作者 andyluo7 · 合并时间 2026-04-18 04:10

功能 重要性 6.58 洞察度 5.00

在 AMD ROCm 平台上启用 DFLASH 推测解码,支持 Triton 注意力后端。

feature amd speculative-decoding run-ci

该 PR 值得精读,特别是 `dflash_worker.py` 中的后端选择逻辑和 `triton_backend.py` 中的掩码防护设计,展示了如何优雅地处理平台差异和边缘情况。关注 ROCm 检测的实现方式及其对默认行为的影响。

#23045 [AMD] Fix AMD Multimodal Test - skip nvfp4 tests

作者 yctseng0211 · 合并时间 2026-04-18 00:02

测试 重要性 5.51 洞察度 3.00

在 AMD ROCm 平台上跳过 ModelOpt FP8 和 NVFP4 量化测试,修复 CI 失败。

diffusion test run-ci amd

该 PR 变更简单直接,适合快速了解如何通过平台检测调整测试覆盖。值得关注的设计决策是选择在测试配置层而非运行时处理硬件不兼容问题,这降低了核心代码复杂度,但可能牺牲测试完整性。建议结合 review 中的讨论,思考未来如何更精细地管理跨平台测试策略。

2026-04-17

#23073 [AMD] mirror nightly images to local registry and prefer LAN pulls

作者 yctseng0211 · 合并时间 2026-04-17 19:49

基础设施 重要性 5.72 洞察度 4.00

为 AMD CI 新增内网 Docker registry 镜像和 LAN 优先拉取策略,解决 Docker Hub rate limit 问题。

amd run-ci

该 PR 值得运维和 CI 工程师精读,重点关注镜像拉取策略的设计决策(如优先级顺序和重试逻辑),以及硬编码 IP 和代码重复等可维护性改进点。

#22974 [AMD] fix AMD CI gate

作者 yctseng0211 · 合并时间 2026-04-17 18:32

基础设施 重要性 4.70 洞察度 3.00

修复 AMD CI 门控逻辑,确保调度/全量测试模式下所有子测试都能执行。

amd run-ci

此 PR 主要面向 CI 维护者和 AMD 平台开发者。建议关注 `.github/workflows/pr-test-amd.yml` 中 `sgl-kernel-unit-test-amd` 作业的条件逻辑和 `run` 步骤的变更,理解其如何通过 `CONTINUE_ON_ERROR` 环境变量区分 PR 模式与调度/全量模式。对于一般开发者,无需深入研读。

功能 重要性 4.92 洞察度 5.00

新增环境变量 SGLANG_MORI_MOE_MAX_INPUT_TOKENS,在 MoE 计算前截断调度缓冲区以减少填充开销。

feature moe amd performance documentation

该 PR 值得关注其设计权衡:通过环境变量控制性能优化,但牺牲了部分安全性。建议精读 `run_moe_core` 中的截断逻辑,理解其与 `mori_op.combine` 的交互,并注意 review 中提到的潜在改进点。

缺陷修复 重要性 7.01 洞察度 5.00

修复CI任务监控脚本中的队列时间、利用率和摘要指标计算错误。

ci bugfix amd

对于负责CI基础设施或监控的工程师,值得精读以了解如何正确处理GitHub Actions API数据并优化监控脚本;重点关注使用runner_name作为状态区分器的设计决策和参数化时间窗口的可配置性改进。

基础设施 重要性 9.00 洞察度 5.00

回退AMD GPU上的MXFP4量化模型支持,修复CI依赖安装失败。

dependencies amd quant

该PR值得精读,以理解依赖版本不匹配如何导致功能回退的典型案例。关注点包括:1) petit.py中配置类的重构如何简化代码结构,2) petit_utils.py中的错误处理设计如何优雅降级,3) 配置文件的联动调整确保系统一致性。对于基础设施团队,可借鉴CI依赖管理的最佳实践。

#19143 feat: Support MXFP4 quantized dense models on AMD CDNA2/CDNA3 GPUs

作者 fengli1702 · 合并时间 2026-04-17 07:51

功能 重要性 9.00 洞察度 6.00

新增 Petit MXFP4 量化方案,支持 AMD CDNA2/CDNA3 GPU 运行 FP4 量化模型。

feature amd quant performance dependencies

建议精读以了解量化管道集成设计,重点关注 `petit_mxfp4.py` 中的配置类实现和 `petit_utils.py` 中的兼容性检查逻辑,这些体现了 AMD 平台扩展和第三方内核集成的权衡。