Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-20 09:06 同步状态:空闲 下次计划:2026-04-20 10:06

PR 列表

已合并 969 · 已分析 969
更多筛选
2026-04-05
重构 重要性 5.00 洞察度 5.00

隔离Speculative Decoding V1的后处理路径,将推理令牌追踪移至验证阶段。

建议技术管理者和核心工程师精读此PR,重点关注scheduler_output_processor_mixin.py的process_batch_result_decode函数重构,理解is_spec_v1变量的使用和_handle_finished_req辅助函数的设计。这有助于掌握解码后处理的架构改进,并为类似重构提供借鉴。

documentation 重要性 3.00 洞察度 2.00

更新文档,将GLM-5模型纳入DeepSeek V3.2使用指南并补充配置说明。

该PR是简单的文档更新,无需精读代码。建议关注文档中关于GLM-5与DeepSeek V3.2共享DSA结构但推理解析器和工具调用解析器不同的说明,这对用户正确配置模型有指导意义。

功能 重要性 6.00 洞察度 6.00

为扩散模型平台抽象添加 float64 支持检测 API,并替换硬编码检查以提升跨平台一致性。

建议精读此 PR,以学习如何抽象平台特定功能并统一代码库中的条件逻辑。关注 is_float64_supported 和 is_amp_supported 的设计,以及在不同模型文件中的替换策略。

#21405 Enable IndexCache for DeepSeek V3.2

原始 PR · 作者 jinyouzhi · 合并时间 2026-04-05 17:45

功能 重要性 7.00 洞察度 7.00

为DeepSeek V3.2模型启用IndexCache优化,提升推理性能。

该PR值得精读,特别是对于从事模型优化和注意力机制开发的工程师。重点关注skip_topk逻辑的设计决策、索引复用的实现细节以及性能与精度的权衡。同时,注意review中讨论的测试最佳实践和代码修正点。

#22140 [Fix] Fix nightly tests

原始 PR · 作者 Fridge003 · 合并时间 2026-04-05 17:26

缺陷修复 重要性 5.00 洞察度 3.00

修复夜间测试的多个不稳定和配置问题,提升CI可靠性。

建议关注CI测试维护的工程师精读此PR,了解如何识别和修复不稳定测试;对于核心模型或内核开发者,可快速浏览以知晓测试环境变化。

重构 重要性 4.00 洞察度 5.00

将推理相关测试整合到统一目录,减少CI服务器启动次数。

建议阅读此PR以了解测试架构的改进模式,特别是混合类设计。重点关注review中讨论的测试覆盖和错误处理问题,作为后续测试优化的参考点。

#22059 [diffusion] fix FLUX[1,2]

原始 PR · 作者 yhyang201 · 合并时间 2026-04-05 16:03

缺陷修复 重要性 6.00 洞察度 5.00

修复FLUX.1和FLUX.2模型中guidance_embedder权重加载和guidance_scale缩放问题,对齐HuggingFace Diffusers。

建议技术管理者和工程师精读denoising.py中的_build_guidance()修改和flux.py中的配置重构,关注如何通过条件判断区分FLUX.1和FLUX.2的逻辑。这些变更体现了在兼容不同模型版本时的设计权衡,值得学习其模块化处理和一致性对齐策略。

功能 重要性 6.00 洞察度 6.00

新增Voxtral语音转文本模型支持,扩展SGLang多模态能力。

建议技术管理者和工程师精读此PR,重点关注:1. 如何集成新模型架构到SGLang框架。2. 多模态处理器设计,特别是处理HF限制时的变通方案。3. tokenizer兼容性补丁的实现细节,这对未来集成类似模型有借鉴意义。

参与讨论