Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 12:34 同步状态:空闲 下次计划:2026-06-07 13:34

PR 列表

更多筛选
2026-05-12
重构 重要性 4.98 洞察度 3.00

清理投机解码和注意力中的死参数与注释

值得快速审查并合并。这是一个教科书式的代码清理 PR:移除死亡代码、修正过时注释。对于关注代码健康的团队,值得鼓励此类 PR。此外,其中关于 Mamba state scatter kernel 参数命名的清理可作参考,展示了如何使测试变量名与生产代码对齐。

功能 重要性 7.92 洞察度 4.00

新增 Azure Blob Storage 连接器,支持 az:// 和 blob.core.windows.net 协议

建议 merge,本 PR 实现干净、遵循现有模式、可维护。后续可补充针对 `blobfile` mock 的单元测试,以及更新文档以反映支持 Azure URL。值得关注的设计决策是:lazy import 模式已作为处理可选依赖的标准在 S3 connector 中应用,本 PR 进一步验证了该模式的扩展性。

性能优化 重要性 8.59 洞察度 5.00

跳过 KV 缓存池分配,节省显存并提升吞吐

建议精读。该 PR 的设计模式(no-op pool 子类保持接口兼容)有参考价值。对于 embedding 服务用户,建议启用该标志以获得显存收益。代码结构清晰,测试完善(8 种组合),值得团队内部学习。

参与讨论