#23110 Clean up bench_one_batch warning and simplify norm dispatch
作者 merrymercy · 合并时间 2026-04-18 08:42
清理基准测试警告并简化归一化函数分发逻辑,提升代码清晰度。
该PR值得快速浏览,重点关注归一化函数分发逻辑的简化方式,这是一种常见的代码优化模式;对于涉及设备特定逻辑(如musa)的清理,可思考是否在其他地方有类似遗留代码需要统一处理。
标签列表
聚合结果
作者 merrymercy · 合并时间 2026-04-18 08:42
清理基准测试警告并简化归一化函数分发逻辑,提升代码清晰度。
该PR值得快速浏览,重点关注归一化函数分发逻辑的简化方式,这是一种常见的代码优化模式;对于涉及设备特定逻辑(如musa)的清理,可思考是否在其他地方有类似遗留代码需要统一处理。
作者 ch-wan · 合并时间 2026-04-18 08:05
重构MoE Triton runner路径,提取共享助手以消除代码重复。
该PR值得精读,特别是对于涉及MoE模块或代码重构的工程师。关注如何提取共享助手以处理平台差异(CUDA/HIP/XPU)、保持LoRA钩子兼容性以及通过配置管理确保bit-identical的设计决策。
作者 hnyls2002 · 合并时间 2026-04-18 04:36
合并 /get_load 到 /v1/loads,统一负载报告路径并弃用旧端点。
该 PR 值得精读,尤其关注数据结构的统一设计和向下兼容处理。值得注意的设计决策包括:在 `GetLoadsReqOutput` 中新增 `num_total_tokens` 字段以区分已使用和总令牌数,以及通过垫片保留旧 API 的平滑迁移路径。
作者 merrymercy · 合并时间 2026-04-18 04:33
移除已弃用的双稀疏注意力优化特性,清理代码库和相关文档。
建议开发者浏览此 PR 以学习如何安全移除大型特性,重点关注跨文件引用清理和文档更新模式;对于涉及类似弃用代码清理的项目,可参考此次实现步骤。
作者 alisonshao · 合并时间 2026-04-17 09:51
拆分 Qwen3.5 FP4 模型测试文件并增加 CI 分区,避免超时失败。
该 PR 是基础设施优化,值得技术管理者关注 CI 配置变更以调整测试策略;工程师可参考测试分割策略,在类似场景下优化测试套件执行时间。
作者 mickqian · 合并时间 2026-04-17 08:35
重构 LTX-2 扩散管道,将图像编码逻辑从去噪阶段提取为独立阶段。
该 PR 值得精读,以了解扩散管道重构的设计模式。重点关注 `LTX2ImageEncodingStage` 的设备管理机制和输入处理逻辑,以及如何与 SP 分片协同。同时,注意 review 中提到的输入验证问题,可作为未来改进点。
作者 hnyls2002 · 合并时间 2026-04-17 06:37
提取 FanOutCommunicator 类并采用声明式配置表,简化通信器管理。
该 PR 值得精读,尤其是 `FanOutCommunicator` 类的设计(支持 queueing/watching 模式)和声明式配置表的实现方式,展示了如何通过抽象减少重复代码。关注点包括通信器的状态管理(如 `_result_event` 和 `_ready_queue`)以及 review 中讨论的类型安全和健壮性改进。
作者 hnyls2002 · 合并时间 2026-04-17 06:01
统一 server_args 中的环境变量读取方式,从工具函数改为 environ 描述符。
该 PR 是一次典型的代码风格重构,值得快速浏览以了解环境变量管理的最佳实践。重点关注 `server_args.py` 中环境变量读取点的统一模式,以及 `environ.py` 中新增描述符的同步添加。对于涉及类型转换的逻辑(如 NPU fused MOE mode)应仔细验证,但整体风险可控。