#7405 [CI] Add pytest failure log collection and persistence
作者 EmmonsCurse · 合并时间 2026-04-16 22:56
为CI添加pytest失败日志收集与持久化功能,提升调试效率。
该PR值得快速浏览,重点关注`pytest_runtest_makereport`钩子的实现方式,以及文件名清洗和导入结构调整的设计决策。对于CI基础设施维护者,可借鉴其日志收集机制以优化其他项目的测试调试流程。
标签列表
聚合结果
作者 EmmonsCurse · 合并时间 2026-04-16 22:56
为CI添加pytest失败日志收集与持久化功能,提升调试效率。
该PR值得快速浏览,重点关注`pytest_runtest_makereport`钩子的实现方式,以及文件名清洗和导入结构调整的设计决策。对于CI基础设施维护者,可借鉴其日志收集机制以优化其他项目的测试调试流程。
作者 RuohengMa · 合并时间 2026-04-16 14:28
将 XPU 平台的 block_attn 算子拆分为可独立控制的 spliced 版本,提升优化灵活性。
建议技术管理者关注此 PR 的设计决策:如何通过环境变量实现渐进式优化,以及兼容性处理策略。工程师可精读 `block_attn_spliced.cc` 了解 spliced 算子拆分逻辑,并参考 `test_block_attn.py` 学习数值验证方法,同时注意 review 中提到的 bug 和依赖风险。
作者 juncaipeng · 合并时间 2026-04-15 20:13
支持PD分离部署无需路由器,放宽配置限制并新增测试验证。
该PR值得精读,特别是配置松耦合的设计决策(如`init_pd_info`逻辑调整)和测试模拟无路由器部署的方法。建议关注并发处理优化和兼容性权衡,以指导类似部署场景的实现。
作者 EmmonsCurse · 合并时间 2026-04-09 22:22
将9个高内存消耗测试标记为顺序执行,避免并发OOM导致的CI不稳定。
该PR值得快速浏览以了解CI测试执行优化策略,但无需深入代码细节。重点关注:1. 高风险测试的识别和分类逻辑;2. review中关于硬编码和维护性的讨论,可作为未来CI脚本改进的参考。
作者 zhoutianzi666 · 合并时间 2026-04-09 17:23
新增 Hopper 架构 DeepEP 低延迟精度测试,验证分布式 MoE 操作的正确性。
该 PR 值得测试工程师和分布式系统开发者关注,特别是学习如何编写多 GPU 精度测试用例和代码规范实践。可以关注返回码检查逻辑的修正和版权声明的添加,以提升测试质量。
作者 cloudforge1 · 合并时间 2026-04-09 14:28
为 config.py 补充单元测试,覆盖率从 83% 提升至 99%。
该 PR 值得精读,特别是对于学习如何高效设计单元测试、使用工厂函数和 Mock 技术,以及代码精简策略。关注测试类结构和覆盖率提升方法。
作者 cloudforge1 · 合并时间 2026-04-09 13:46
为FastDeploy引擎模块添加全面单元测试,覆盖率从51%提升至92%。
建议engine模块开发者和测试工程师精读此PR,学习如何为复杂引擎编写全面单元测试,特别是mock策略和配置构造。关注review中讨论的patch技巧,避免环境变量污染和测试不稳定性陷阱。
作者 EmmonsCurse · 合并时间 2026-04-08 16:54
大幅缩减ngram kernel测试执行时间,从6分钟降至20秒,提升CI效率。
该PR展示了CI优化中测试时间与覆盖率的典型权衡。建议精读fastdeploy-bot的评论,思考如何平衡CI效率与测试有效性。对于性能基准测试,可考虑在CI配置中排除或仅在特定触发条件下运行,而非修改参数使其失效。