默认种子改为42,重构partitioning与disagg种子传递
建议关注 partitioning 模块提取的设计(单一职责、可复用)、DenoisingContext 数据类与字典返回的权衡、disagg 种子传递的演进。该 PR 展示了增量重构与特性增强的合并模式,适合用于学习渐进式重构。
SGLang is a high-performance serving framework for large language models and multimodal models.
默认种子改为42,重构partitioning与disagg种子传递
建议关注 partitioning 模块提取的设计(单一职责、可复用)、DenoisingContext 数据类与字典返回的权衡、disagg 种子传递的演进。该 PR 展示了增量重构与特性增强的合并模式,适合用于学习渐进式重构。
改善 FP8 GEMM 调优脚本可用性与负载均衡
可直接合并。该 PR 虽小,但参数命名和负载均衡等改进符合作者提出的动机。建议后续考虑添加单元测试覆盖调优脚本的边界情况。
统一 torch profiler 分析脚本并更新 CI 技能文档
建议合并,代码质量良好,review 建议可后续单独修复 runner 命名问题。值得关注的设计决策是 profiler 分析脚本的统一化架构,特别是跨框架的 `canonicalize_framework` 和 `normalize_repo_relative_path` 设计。
原始 PR · 作者 jiangyinzuo · 合并时间 2026-04-28 17:05
为 PP pipeline 添加 OpenTelemetry 追踪
值得精读。PR 展示了如何在调度循环的轻量热路径中注入可观测性代码,设计上注重最小侵入和性能开销控制。命名讨论和属性传递方式的简化体现了对可维护性的关注,可作为同类追踪功能的参考模式。
实现 Elastic EP 失败进程恢复与动态重新加入
值得精读,特别是对分布式系统和容错机制感兴趣的开发者。该 PR 展示了如何在不阻塞在线服务的前提下恢复失败节点,设计上的权衡(如同步与异步、性能与可靠性)具有教育意义。但需注意当前实现依赖 Mooncake 库的内部语义,通用性受限;性能优化留给后续 PR。
原始 PR · 作者 yaya159456 · 合并时间 2026-04-28 14:40
修复 Eagle 模式下 draft 与 target 张量文件路径冲突
值得合并,修复明确、改动小且有测试(虽无自动化测试但手动验证可行)。设计决策上,将角色判断放在模型 runner 层而非 hook 层是合理的,保持了 hook 接口的纯净。文档配套同步值得赞扬。
修复 cookbook 中 CLI 参数 --model 改为 --model-path
值得合并,但无需精读。推荐关注类似文档的一致性检查。
移除测试和注释中的 'smoke' 措辞
该 PR 属于纯代码清理,不涉及功能变更,适合在代码审查中快速过目。对于追求代码术语一致性的项目,这是一个可取的实践。建议关注 gemini-code-assist 提出的不一致问题,确保后续修复。
参与讨论