简化测试日志捕获,移除临时文件改用继承stdout/stderr。
该PR变更简单直接,适合快速浏览以了解测试基础设施的改进。值得关注的点是移除了对特定错误信息的断言检查,团队需评估这是否会降低测试的健壮性。对于涉及流式会话和内存泄漏测试的开发者,建议了解日志捕获方式的变更。
SGLang is a high-performance serving framework for large language models and multimodal models.
简化测试日志捕获,移除临时文件改用继承stdout/stderr。
该PR变更简单直接,适合快速浏览以了解测试基础设施的改进。值得关注的点是移除了对特定错误信息的断言检查,团队需评估这是否会降低测试的健壮性。对于涉及流式会话和内存泄漏测试的开发者,建议了解日志捕获方式的变更。
移除AMD ROCm Dockerfile中已由上游aiter v0.1.12.post1修复的临时补丁。
该PR值得快速浏览以了解依赖清理过程,但无需深入分析代码逻辑。关注点在于如何通过上游依赖升级来简化本地补丁,这是基础设施维护的常见模式。
为Intel GPU启用GPT-OSS bf16模型的融合专家MoE内核路径。
该PR值得快速浏览,重点关注:1. 跨平台内核参数传递的设计模式;2. Intel GPU支持扩展的演进方向。虽然变更简单,但体现了平台兼容性工作的典型模式。
重构扩散模型去噪阶段,引入 DenoisingContext 数据类,简化 LTX-2 特定逻辑。
建议精读 `denoising.py` 和 `ltx_2_denoising.py`,关注 `DenoisingContext` 设计、钩子架构以及序列并行方法的实现,这些是本次重构的核心设计决策,有助于理解扩散模型去噪流程的模块化演进。
原始 PR · 作者 polisettyvarma · 合并时间 2026-04-13 13:16
升级 Intel GPU 平台 PyTorch 依赖至 2.11 版本,同步更新 Docker 和文档。
该 PR 是常规依赖升级,值得关注以确保测试覆盖和向后兼容性;工程师应检查相关模块是否有 API 变化需要适配。
为 hisparse JIT 内核添加 CI 测试套件,验证 kvcache-swap-in 功能。
建议快速浏览此 PR,了解 hisparse 内核的测试方法和场景设计。对于关注 JIT 内核或 CI 测试的工程师,可以关注测试用例的编写方式。
为hisparse JIT内核添加基准测试脚本,评估缓存加载性能。
对于负责jit-kernel性能优化的工程师,建议浏览此PR以了解基准测试设计和配置参数;但对于一般开发者,无需深入阅读,因为核心代码未变。关注点可放在基准测试方法论和review中的改进建议上。
原始 PR · 作者 alisonshao · 合并时间 2026-04-13 12:48
将CI默认CUDA版本从12.9升级到13.0,以匹配PyTorch 2.11默认。
对于技术管理者和工程师,建议快速浏览此PR以了解CUDA版本升级的CI配置变更,重点关注ci_install_dependency.sh中的wheel安装逻辑和测试计划执行情况,确保CI稳定后再推进Docker镜像更新。
参与讨论