#20700 fix(serving_chat): catch TypeError from tojson on Jinja2 Undefined variables
原始 PR · 作者 fanghao566 · 合并时间 2026-05-23 00:43
修复 Jinja2 模板 tojson 未定义变量错误处理
该 PR 值不值得精读取决于是否负责聊天模板或错误处理模块。对于其他开发者而言,这是一个教科书级的防御性错误处理改进,值得了解但不必须深入。
SGLang is a high-performance serving framework for large language models and multimodal models.
原始 PR · 作者 fanghao566 · 合并时间 2026-05-23 00:43
修复 Jinja2 模板 tojson 未定义变量错误处理
该 PR 值不值得精读取决于是否负责聊天模板或错误处理模块。对于其他开发者而言,这是一个教科书级的防御性错误处理改进,值得了解但不必须深入。
禁用 diffusion 夜间对比中的 torch compile
可快速合入的维护性变更。建议关注后续是否有 torch compile 兼容性修复的 PR,届时可恢复此选项。
原始 PR · 作者 IPostYellow · 合并时间 2026-05-22 23:34
修复 Wan VAE 解码 channels_last_3d 格式导致的视觉损坏
值得所有涉及扩散模型推理的开发者精读,尤其是处理内存格式兼容性和分布式通信的注意事项。该 PR 展示了如何平衡性能与正确性。
原始 PR · 作者 zhangtao2-1 · 合并时间 2026-05-22 23:09
新增 MiniCPM5 XML 格式工具调用解析器
值得精读。该 PR 是工具调用框架的一次典型扩展,展示了 parser 注册、自动检测规则添加和流式边界处理的完整实践。特别推荐关注 `detect_and_parse` 中的多路径解析(lxml primary + regex fallback)和 `parse_streaming_increment` 中的缓冲区管理逻辑。
为 diffusion CI 添加 GT 图像质量门,防止发布低质量/噪声图像
值得精读,尤其是质量指标计算和远程 Blob API 交互的实现。展示了 CI 流程中引入数据质量门的实践模式,可复用于其他需要资产质量验证的场景。
原始 PR · 作者 FredHuang99 · 合并时间 2026-05-22 18:50
扩散管道引入角色感知的组件加载与阶段亲和性
该 PR 值得精读,它是 diffusion 管道迈向分解部署的关键环节,角色分离架构与 stage 亲和性模式对后续多 GPU 部署和内存优化有重要借鉴意义。建议重点关注 `_get_extra_allowed_modules_for_role` 的设计权衡(中央 vs 分散)以及 stage 创建时的角色跳过逻辑,同时注意未来可能需要的白名单重构。
原始 PR · 作者 kousakawang · 合并时间 2026-05-22 18:39
修复 Step3-VL 图像处理器 GPU Tensor 兼容性 bug
建议所有使用 Step3-VL 的用户升级到此 PR,以解决 JPEG 图像请求失败问题。设计上对 Tensor 输入的适配模式(get_image_size、函数重载)值得学习,可用于类似多模态处理器兼容性修复。
原始 PR · 作者 polisettyvarma · 合并时间 2026-05-22 18:23
deepseek_v4_rope 中的 tilelang 导入改为可选
该 PR 改动简单明了,建议工程师在涉及可选依赖时参考此模式(`try-except` 包裹模块级配置)。建议后续补充测试,验证 `tilelang` 不存在时模块导入正常且相关功能有降级处理。
参与讨论