#24095 [misc] fix lint in main branch
原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-30 06:01
修复 main 分支 lint 问题
无特殊阅读价值,但可用于了解项目的代码风格期望。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-30 06:01
修复 main 分支 lint 问题
无特殊阅读价值,但可用于了解项目的代码风格期望。
原始 PR · 作者 Kangyan-Zhou · 合并时间 2026-04-30 05:59
运行 black 格式化修复 lint
直接合并,无需精读。可关注 black 版本的 CI 配置一致性,防止类似问题。
修复 Qwen3-Next FP8 量化加载错误
该 PR 值得精读,因为它展示了 FP8 量化配置中 `modules_to_not_convert` 与融合层映射的微妙交互,以及回归问题的诊断过程。测试文件的设计清晰且具有代表性,可作为类似场景的测试模板。
原始 PR · 作者 fortunecookiee · 合并时间 2026-04-30 04:51
提升 Score API 查询占位符扫描并优化 PositionalEmbeds 堆叠
值得精读其设计权衡:如何通过提升不变计算和分派堆叠优化性能,以及保留更高层接口供测试调用的做法。
原始 PR · 作者 Qiaolin-Yu · 合并时间 2026-04-30 04:40
默认启用 spec v2 推测解码
该 PR 值得仔细阅读,特别是 `server_args.py` 中默认逻辑的设计和测试用例的配套调整。展示了如何将一个实验性特性平稳切换为默认,同时保留回退路径。对于使用推测解码的开发者,应了解新的默认行为和降级条件。推荐关注后续是否有针对 topk>1 支持的 PR。
统一 CI 中 Rust 与 protoc 安装流程
建议合并,该 PR 通过集中化脚本和版本锁定显著提升 CI 可维护性,值得作为 CI 标准化参考。
移除 DeepSeek V4 文档中过时提示
该 PR 无需深入阅读。作为常规文档清理,可以快速合并。
原始 PR · 作者 AndyDai-nv · 合并时间 2026-04-30 03:57
为 ModelExpress 添加 NIXL RDMA 传输后端
值得精读:展示了传输层抽象(通过 `transport` 配置分支)和数据契约(`WorkerMetadata` 的 oneof 设计)。建议合并后尽快补充 NIXL 路径的 CI 集成测试,以及验证不同量化模型的张量布局一致性。
参与讨论