Prhub
← 返回仓库详情

标签聚合

sgl-project/sglang · 标签视图

标签列表

聚合结果

refactor 相关 PR

2026-04-18

#23110 Clean up bench_one_batch warning and simplify norm dispatch

作者 merrymercy · 合并时间 2026-04-18 08:42

重构 重要性 5.64 洞察度 3.00

清理基准测试警告并简化归一化函数分发逻辑,提升代码清晰度。

sgl-kernel run-ci refactor

该PR值得快速浏览,重点关注归一化函数分发逻辑的简化方式,这是一种常见的代码优化模式;对于涉及设备特定逻辑(如musa)的清理,可思考是否在其他地方有类似遗留代码需要统一处理。

重构 重要性 8.76 洞察度 6.00

重构MoE Triton runner路径,提取共享助手以消除代码重复。

refactor moe performance run-ci

该PR值得精读,特别是对于涉及MoE模块或代码重构的工程师。关注如何提取共享助手以处理平台差异(CUDA/HIP/XPU)、保持LoRA钩子兼容性以及通过配置管理确保bit-identical的设计决策。

#23010 Merge /get_load into /v1/loads

作者 hnyls2002 · 合并时间 2026-04-18 04:36

重构 重要性 8.23 洞察度 5.00

合并 /get_load 到 /v1/loads,统一负载报告路径并弃用旧端点。

refactor model-gateway run-ci observability

该 PR 值得精读,尤其关注数据结构的统一设计和向下兼容处理。值得注意的设计决策包括:在 `GetLoadsReqOutput` 中新增 `num_total_tokens` 字段以区分已使用和总令牌数,以及通过垫片保留旧 API 的平滑迁移路径。

#23009 Remove deprecated double sparsity feature

作者 merrymercy · 合并时间 2026-04-18 04:33

重构 重要性 8.50 洞察度 3.00

移除已弃用的双稀疏注意力优化特性,清理代码库和相关文档。

refactor documentation npu run-ci

建议开发者浏览此 PR 以学习如何安全移除大型特性,重点关注跨文件引用清理和文档更新模式;对于涉及类似弃用代码清理的项目,可参考此次实现步骤。

2026-04-17
重构 重要性 8.75 洞察度 6.00

重构 LTX-2 扩散管道,将图像编码逻辑从去噪阶段提取为独立阶段。

diffusion refactor run-ci

该 PR 值得精读,以了解扩散管道重构的设计模式。重点关注 `LTX2ImageEncodingStage` 的设备管理机制和输入处理逻辑,以及如何与 SP 分片协同。同时,注意 review 中提到的输入验证问题,可作为未来改进点。

#22967 refactor: extract FanOutCommunicator and use declarative spec table

作者 hnyls2002 · 合并时间 2026-04-17 06:37

重构 重要性 9.00 洞察度 6.00

提取 FanOutCommunicator 类并采用声明式配置表,简化通信器管理。

refactor run-ci hicache documentation

该 PR 值得精读,尤其是 `FanOutCommunicator` 类的设计(支持 queueing/watching 模式)和声明式配置表的实现方式,展示了如何通过抽象减少重复代码。关注点包括通信器的状态管理(如 `_result_event` 和 `_ready_queue`)以及 review 中讨论的类型安全和健壮性改进。

#22994 use envs in server_args

作者 hnyls2002 · 合并时间 2026-04-17 06:01

重构 重要性 5.64 洞察度 3.00

统一 server_args 中的环境变量读取方式,从工具函数改为 environ 描述符。

refactor run-ci observability

该 PR 是一次典型的代码风格重构,值得快速浏览以了解环境变量管理的最佳实践。重点关注 `server_args.py` 中环境变量读取点的统一模式,以及 `environ.py` 中新增描述符的同步添加。对于涉及类型转换的逻辑(如 NPU fused MOE mode)应仔细验证,但整体风险可控。