LTX2 original 模式 stage-2 改用动态 LoRA
值得精读。该 PR 展示了在共享权重场景下,通过动态 LoRA 避免请求路径上权重变动的设计思路。建议关注 review 中关于阶段无关性的建议,考虑在后续迭代中统一处理 `original` 模式的所有阶段。
SGLang is a high-performance serving framework for large language models and multimodal models.
LTX2 original 模式 stage-2 改用动态 LoRA
值得精读。该 PR 展示了在共享权重场景下,通过动态 LoRA 避免请求路径上权重变动的设计思路。建议关注 review 中关于阶段无关性的建议,考虑在后续迭代中统一处理 `original` 模式的所有阶段。
原始 PR · 作者 whybeyoung · 合并时间 2026-05-18 22:57
修复 PD decode 中止请求残留导致超时问题
建议尽快合并,属于关键 bugfix;后续可考虑补充相关单元测试。
原始 PR · 作者 Gruner-atero · 合并时间 2026-05-18 22:02
SMG添加/v1/models模型名称发现回退
值得精读,特别是fallback模式的实现和测试设计。核心函数`get_model_name_from_v1_models`的JSON字段验证是良好的API适配实践。如果使用SMG,建议关注此变更,并考虑扩展类似回退逻辑。
原始 PR · 作者 xieminghe1 · 合并时间 2026-05-18 21:35
为 DeepSeekV4 添加 fused MoE Triton autotune 支持
PR 改动简洁清晰,适合作为支持新模型架构调优的参考模板。建议关注 `swiglu_limit` 值的通用性,未来可考虑从模型配置中自动推导。
原始 PR · 作者 ShangmingCai · 合并时间 2026-05-18 19:56
为 fake KV backend 添加 abort 与状态管理
该 PR 逻辑清晰、改动量小,属于常规维护级别的 bugfix/功能补强,值得合并。但其重要性较低,不需精读。
修复 flush_cache 因 is_stats_logging_rank 报错
快速审核并合并。此 PR 修复了因之前重构引起的关键路径回归,对保证 CI 正常和服务器稳定性至关重要。
修复标签移除时CI状态被覆盖
此 PR 值得阅读,特别是对维护 CI 工作流的工程师。它展示了如何使用 GitHub API 以及通过预睡眠和重试处理竞态条件的典型方法。简单但有效。
删除 scheduler.py 中无用的 is_work_request 函数
值得快速合并的清理 PR。作为重构链的一环,建议确认前序 free-item relocation PR 已合入,以确保上下文一致。无需精读。
参与讨论