Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 10:11 同步状态:空闲 下次计划:2026-06-07 11:11
后台正在同步并分析最近 PR,页面会自动刷新并逐步显示最新结果。

PR 列表

更多筛选
2026-05-19
文档 重要性 4.93 洞察度 2.00

统一镜像仓库并重构NPU文档结构,提升易用性

建议所有 NPU 用户和开发者阅读更新后的文档,特别是快速入门和示例部分。文档中新增的磁盘空间警告、FAQ 和测试指引值得注意,有助于避免常见陷阱。对于文档维护者,此 PR 展示了使用 Tabs、Tip、Warning 等 MDX 组件结构化文档的最佳实践。

#23506 [gRPC] Native server: Rust crate (1/4)

原始 PR · 作者 alexnails · 合并时间 2026-05-19 13:31

功能 重要性 9.36 洞察度 6.00

引入 Rust gRPC 服务器 crate,原生服务器第一阶段

值得精读,特别是对 Rust ↔ Python 桥接模式感兴趣的人员。设计决策如 `RequestAbortGuard` Drop 语义、`pyerr_to_status` 分类、`resolve_max_message_size` 环境变量覆盖,都是良好的工程实践。未解决的 meta_info 序列化和认证问题应在后续 PR 中优先修复。

为 Wan2.2 Diffusion 添加 Ascend NPU MXFP4 量化支持

建议精读该 PR,它展示了如何在 diffusion 子系统中集成新的量化方法,代码模块化良好(在线 vs 离线分离),且 review 中涉及的性能优化和设计决策值得借鉴。需特别关注在线量化路径的实验性标注以及加载器逻辑对 modelslim 显式标志的改动。

参与讨论