Prhub
← 返回仓库列表

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-04-18 19:19 同步状态:空闲 下次计划:2026-04-18 20:19

PR 列表

已合并 957 · 已分析 957
更多筛选
2026-03-22
缺陷修复 重要性 6.00 洞察度 5.00

修复多个图像扩散模型的准确性问题,通过对齐官方实现和修复序列并行偏差。

建议扩散模型开发者和维护者精读此PR,特别是qwen_image.py和zimage.py中的序列并行处理设计,以及USPAttention的扩展实现,以学习多GPU下注意力机制的优化策略和对齐官方实现的技巧。

文档 重要性 4.00 洞察度 4.00

更新SGLang测试编写技能,添加后端无关测试仅用CUDA和优先使用mock的规则。

对于负责编写或维护测试的开发者,值得精读以了解新规则和实践,特别是后端无关测试的CI注册策略和mock使用的权衡。对于其他工程师,可浏览以了解测试策略优化方向。关注的设计决策包括如何平衡测试覆盖与CI资源消耗。

2026-03-20
基础设施 重要性 3.00 洞察度 4.00

将NPU扩散模型CI性能基线TextEncodingStage时间从301ms提升至1200ms,以解决CI测试偶发性超时失败。

该PR变更简单直接,适合快速浏览以了解CI基线调整策略。值得关注的是review中提出的关于性能测试方法论和根本原因分析的讨论,这对维护稳定的CI/CD流程有借鉴意义。

参与讨论