#26775 fix test cases failed on 5/30 in nightly pipeline
原始 PR · 作者 liuxianglong17 · 合并时间 2026-06-04 20:07
修复 NPU 夜间测试失败问题
该 PR 为常规维护性修复,无需精读。但可关注 `test_ascend_utils.py` 中权重路径和环境变量的管理方式,作为测试基础设施维护的参考。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 liuxianglong17 · 合并时间 2026-06-04 20:07
修复 NPU 夜间测试失败问题
该 PR 为常规维护性修复,无需精读。但可关注 `test_ascend_utils.py` 中权重路径和环境变量的管理方式,作为测试基础设施维护的参考。
原始 PR · 作者 liuxianglong17 · 合并时间 2026-06-04 20:07
NPU 测试超时修复:watchdog-timeout 从 300 提升到 900
该 PR 属于应急性质的小幅参数调整,不值得精读。但可作为测试基础设施维护的参考:对于超时类失败,适当放宽阈值是快速稳定 CI 的手段之一。建议同时记录权重加载预期时间,并考虑后续优化加载速度以从根本上消除超时风险。
原始 PR · 作者 liuxianglong17 · 合并时间 2026-06-04 20:06
启用 NPU 全量测试套件中的 6 个用例
无需精读;属于常规的测试配置恢复操作,可快速合并。
修复实时录制时间线,使用解码帧序列而非预览帧
建议精读 `app.js` 中的重构逻辑,特别是 `recordDecodedFrame` 和 `createRecordingFrame` 的实现,这是将录制从预览循环解耦的关键设计。关注编码错误级联问题,可作为后续改进方向。
原始 PR · 作者 huangtingwei9988 · 合并时间 2026-06-04 18:01
修复 PD 模式下 decode 响应中 L3 缓存命中报告的缺失问题
建议快速合并。变更逻辑清晰、改动量小、风险低,且解决了一个实际观测到的监控数据缺失问题。
gzip压缩级别从1降为0,加速RGB传输
该PR变更简洁高效,性能收益显著且风险可控。值得精读以了解实时传输场景下的性能优化思路。
为繁忙时内存检查添加安静模式,减少日志噪声
该 PR 设计简洁,改动集中,风险低,值得合并。建议在文档中备注级别 1 的缓冲区容量说明,以便用户了解极限场景下的日志覆盖能力。
原始 PR · 作者 alisonshao · 合并时间 2026-06-04 16:25
为 CPU CI 添加 HuggingFace 缓存
建议合入。该 PR 采用了一致且成熟的 `actions/cache` 模式(与仓库其他 job 类似),可显著提高 CI 稳定性。值得关注的是其 cache key 设计:使用 `github.run_id` 做滚动 key,每次新 run 都会创建新 cache,同时使用 `restore-keys` 回退到旧 cache,既保证了增量更新又提供了回退路径。
参与讨论