Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-20 10:07 同步状态:空闲 下次计划:2026-04-20 11:07

PR 列表

已合并 969 · 已分析 969
更多筛选
2026-04-04
基础设施 重要性 5.00 洞察度 5.00

改进扩散模型基准测试设置,提升性能真实性并自动发现单元测试。

建议工程师重点关注 server_args.py 的端口逻辑变更和 comparison_configs.json 的 benchmark 设置,以了解 CI 改进细节;对于性能优化,可参考 LTX-2 benchmark 的配置选择。

功能 重要性 7.00 洞察度 6.00

添加自动化基准测试工具,支持YAML配置驱动的服务器标志搜索和规范数据集格式。

建议工程师精读此PR,重点关注YAML配置设计、分层搜索策略和错误处理机制。该工具适用于性能调优场景,但需注意风险管理,如设置合理的搜索超时和验证数据集格式。

文档 重要性 5.00 洞察度 4.00

对齐扩散模型 nightly 基准测试预设与技能文档,以 LTX-2 案例为中心并扩展机会发现指导。

建议开发者和性能工程师精读更新的技能文档,特别是 `existing-fast-paths.md`,以了解新增的融合 QK norm + RoPE 等机会指导。同时,关注 `bench_diffusion_denoise.py` 中的 denoise 延迟计算逻辑,确保其正确性。此 PR 展示了文档与配置对齐对优化生态的重要性,值得一读以理解扩散模型的最佳实践。

缺陷修复 重要性 2.00 洞察度 1.00

修复DeepSeek V3基准测试脚本中Python 3.11不兼容的f-string语法错误。

该PR变更简单直接,无需精读。但可关注review中提到的plot_name冲突问题,如果团队运行相关基准测试,建议后续PR中修复以避免数据覆盖。

缺陷修复 重要性 3.00 洞察度 2.00

修复CI清理脚本无法杀死主服务器进程的问题,确保端口释放。

该PR变更简单直接,适合快速了解CI清理机制。值得关注review中提到的脚本一致性和CLI子命令覆盖问题,可作为后续改进参考。

测试 重要性 3.00 洞察度 4.00

放宽推测解码测试精度阈值,修复因边界值导致的CI不稳定问题。

该PR变更简单直接,适合快速浏览以了解CI测试修复的背景。值得关注的是review中关于测试严格性与稳定性权衡的讨论,以及PR作者对更深度精度问题的提及(已在单独问题中跟踪)。对于关注测试策略或推测解码模块的工程师,可进一步查看关联的精度问题。

#15562 [Feature] Add Reasoning Tokens Usage

原始 PR · 作者 Muqi1029 · 合并时间 2026-04-04 17:18

功能 重要性 6.00 洞察度 6.00

添加推理令牌使用统计,修复当前字段始终为0的问题。

该 PR 值得精读,特别是设计决策:将逻辑放在输出处理器而非服务器进程以避免重新标记化复杂性,以及如何处理推测解码场景的统一令牌ID格式。

重构 重要性 5.00 洞察度 4.00

撤销对SM103 GPU的临时规避措施,恢复TRTLLM attention后端使用以提升性能。

推荐技术管理者和核心工程师精读此PR,关注注意力后端逻辑的简化设计,以及如何协调外部依赖修复进行代码回退的决策过程。

参与讨论