删除因内核回滚而不再需要的融合采样测试文件。
该PR简单,不值得深入精读,但维护者应关注测试覆盖问题;建议检查是否有其他测试覆盖采样逻辑,或考虑后续补充测试以确保质量。
SGLang is a high-performance serving framework for large language models and multimodal models.
删除因内核回滚而不再需要的融合采样测试文件。
该PR简单,不值得深入精读,但维护者应关注测试覆盖问题;建议检查是否有其他测试覆盖采样逻辑,或考虑后续补充测试以确保质量。
修复 CI 测试套件名称并添加验证逻辑,提升测试编排准确性。
该 PR 值得精读,特别是 test/run_suite.py 中的验证机制设计,展示了 CI 测试框架的健壮性改进。关注套件命名标准化策略和验证逻辑的潜在优化点,如 review 中提到的后端感知验证。
原始 PR · 作者 DarkSharpness · 合并时间 2026-04-03 23:28
实现 JIT 激活内核,优化 CUDA 平台 SiLU/GELU 性能并更新技能文档。
建议技术管理者和内核开发者精读此 PR,重点关注 JIT 内核的设计模式(如 PDL 使用、向量化优化)、从 AOT 到 JIT 的迁移策略,以及 review 中提出的兼容性和形状问题。对于工程师,此 PR 提供了高性能内核开发的参考实例,值得学习。
将多模态输入字典替换为类型化数据类,提升代码类型安全性。
推荐精读此PR,关注MultimodalProcessorOutput数据类设计如何平衡类型安全和向后兼容性,以及集中转换策略如何最小化处理器修改,是重构大型代码库的良好案例。
为CI测试模型配置添加可自定义的服务器启动超时参数,解决特定测试超时问题。
该PR变更简单直接,适合快速浏览以了解CI超时配置的扩展机制。值得关注的设计决策是采用`model.launch_timeout or DEFAULT_TIMEOUT_FOR_SERVER_LAUNCH`的条件回退模式,但需注意其潜在陷阱(如0值处理)。建议结合review评论,在实际使用中补充参数文档。
回滚融合采样内核,恢复标准PyTorch温度缩放和softmax操作。
建议技术管理者关注此次回滚背后的根本原因(如性能评估或bug发现),以及是否计划后续优化。工程师可精读以理解融合内核的潜在问题,并学习代码回滚和性能权衡的决策过程。
为内核发布工作流添加版本号格式提示,提升触发准确性。
该 PR 变更简单直接,无需精读。对于负责 CI/CD 或内核发布的工程师,可关注此提示以规范触发流程。
修复 aarch64 内核发布构建失败,优化 wheel 重命名脚本的 Python 路径。
建议工程师在修改构建脚本时关注此类缓存管理和路径问题,此 PR 提供了处理 Docker buildx 构建器状态和 Python 环境隔离的实用模式,值得参考以提升 CI 健壮性。
参与讨论