移除 sgl-kernel 中的过时遗留路径和内核,清理代码库。
该 PR 值得快速浏览以了解代码清理方向,但无需精读细节。对于关注内核演进或 sgl-kernel 模块的工程师,可注意移除的设计决策(如 AOT 到 JIT 的迁移)和过时功能的淘汰趋势。
SGLang is a high-performance serving framework for large language models and multimodal models.
移除 sgl-kernel 中的过时遗留路径和内核,清理代码库。
该 PR 值得快速浏览以了解代码清理方向,但无需精读细节。对于关注内核演进或 sgl-kernel 模块的工程师,可注意移除的设计决策(如 AOT 到 JIT 的迁移)和过时功能的淘汰趋势。
修复 killall.py 在 sglang 未安装时的导入崩溃问题,确保 CI 稳定。
该 PR 变更简单直接,不值得精读,除非关注 CI 脚本细节或 import 依赖管理。可关注内联外部命令调用的模式,以避免模块导入依赖。
原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-01 08:40
移除EAGLE推测解码测试中的冗余用例,显著缩短CI执行时间。
该PR对CI优化有价值,值得快速浏览以理解测试套件结构改进,如冗余测试识别和核心测试提取逻辑,但无需深入代码细节。
将 MooncakeSpec 测试模型从 Llama-2 EAGLE 切换到 Llama-3.1 EAGLE3,并调整精度阈值和并行度。
对于技术管理者和工程师,本 PR 值得快速浏览以了解测试配置的更新。关注点包括:模型切换的背景(Llama-2 分数下降)、新阈值设定的依据(CI 分数 0.775 > 0.74),以及并行度增加对测试性能的潜在优化。
将 hicache 一致性测试的样本数从 50 增加到 200,以降低 flaky 分数差异。
该 PR 变更简单,无需精读。但可以关注参数调整的合理性,如样本数和并行度的选择,以及它们对测试稳定性和性能的平衡。
移除冗余的 MoE 评估测试文件,优化测试套件结构。
此 PR 变更直接,无需深入审查。建议工程师快速浏览以了解测试清理实践,但对于代码学习价值有限。
新增 CompletionSampler,支持通过 /v1/completions API 进行非聊天模型评估。
建议工程团队精读此 PR,关注 `CompletionSampler` 的设计如何与现有 `ChatCompletionSampler` 集成,以及参数提取的优化方式。对于使用非聊天模型的开发者,此功能值得关注。
原始 PR · 作者 happierpig · 合并时间 2026-04-01 07:32
为MOE A2A后端添加自定义选项,以支持正确处理require_mlp_tp_gather。
该PR变更简单机械,无需深度精读,但关注MOE模块或后端集成的工程师可快速浏览以了解自定义选项的添加方式,作为基础设施扩展的参考案例。
参与讨论