Prhub

sgl-project/sglang

SGLang is a high-performance serving framework for large language models and multimodal models.

监控状态:已开启 最近同步:2026-06-07 11:28 同步状态:空闲 下次计划:2026-06-07 12:28

PR 列表

更多筛选
2026-04-24
文档 重要性 4.12 洞察度 1.00

更新DeepSeek V4部署文档中H200 Pro模型仓库地址

本PR是常规文档更新,改动极小,可直接合并。建议关注是否有其他文档中的类似占位符需要一并更新。

#23622 Again update DeepSeek V4 cookbook

原始 PR · 作者 fzyzcjy · 合并时间 2026-04-24 15:12

文档 重要性 4.78 洞察度 3.00

再次更新DeepSeek V4部署指南,新增配方案例和Docker示例

建议部署DeepSeek V4的用户阅读此PR以获取最新的命令行参考。开发者和文档维护者可关注cp配方中参数单一来源的处理方式,以及如何通过`VERIFIED_RECIPES`集合优雅地管理验证状态。此PR体现了sglang项目对文档易用性和准确性的持续投入。

#23628 [codex] docs: note H200 DeepSeek-V4 checkpoint

原始 PR · 作者 zijiexia · 合并时间 2026-04-24 15:06

文档 重要性 2.34 洞察度 1.00

H200 DeepSeek-V4检查点说明

该PR内容简单,但技术信息重要。建议后续将两个重复的H200备注合并,并补充FP4不兼容的技术原因以增强说服力。

缺陷修复 重要性 7.62 洞察度 6.00

修复AMD GPU上使用默认页大小+推测解码时的内存访问错误

PR值得快速合并,是专为AMD GPU上的Triton编译器兼容性问题而设计的安全修复。建议后续为`get_last_loc_triton_safe`添加单元测试,以避免类似编译器回归。

功能 重要性 9.18 洞察度 6.00

添加LTX-2.3高质量两阶段生成流水线

建议精读 `ltx_2_denoising.py` 中的res2s采样器实现(特别是 `_ltx2_res2s_sde_step` 和 `_ltx2_stage2_res2s_step`),这是与官方HQ对齐的核心算法;同时关注 `_merge_lora_into_data` 的分组合并优化,可推广到其他LoRA场景。HQ的sigma调度和重噪声生成器设计也值得参考。

#23617 Further update Deepseek V4 docs

原始 PR · 作者 fzyzcjy · 合并时间 2026-04-24 13:23

其他 重要性 4.50 洞察度 2.00

更新DeepSeek V4 H200文档中的模型仓库地址

该PR属于日常文档维护,逻辑简单,无需精读。但值得留意的是,它反映了DeepSeek V4模型部署生态的进展——sgl-project开始发布FP8重打包模型。若后续Pro FP8也更新,可快速合并。

#23605 Add DeepSeek V4 cookbook

原始 PR · 作者 wisclmy0611 · 合并时间 2026-04-24 13:10

文档 重要性 7.54 洞察度 6.00

添加DeepSeek-V4部署交互指南与命令面板

建议精读`deepseek-v4-deployment.jsx`的生成器实现,其配置驱动、严格对齐外部真实脚本的设计模式值得在后续文档中复用。同时建议在`VERIFIED_RECIPES`中记录验证状态,未来可逐渐扩大覆盖率。

#23607 [AMD] upd local registry address

原始 PR · 作者 yctseng0211 · 合并时间 2026-04-24 12:07

基础设施 重要性 2.81 洞察度 1.00

更新AMD CI本地Docker镜像仓库地址

该PR属于运维层面的常规更新,技术价值低,无需深入阅读。

参与讨论