更新DeepSeek V4部署文档中H200 Pro模型仓库地址
本PR是常规文档更新,改动极小,可直接合并。建议关注是否有其他文档中的类似占位符需要一并更新。
SGLang is a high-performance serving framework for large language models and multimodal models.
更新DeepSeek V4部署文档中H200 Pro模型仓库地址
本PR是常规文档更新,改动极小,可直接合并。建议关注是否有其他文档中的类似占位符需要一并更新。
再次更新DeepSeek V4部署指南,新增配方案例和Docker示例
建议部署DeepSeek V4的用户阅读此PR以获取最新的命令行参考。开发者和文档维护者可关注cp配方中参数单一来源的处理方式,以及如何通过`VERIFIED_RECIPES`集合优雅地管理验证状态。此PR体现了sglang项目对文档易用性和准确性的持续投入。
H200 DeepSeek-V4检查点说明
该PR内容简单,但技术信息重要。建议后续将两个重复的H200备注合并,并补充FP4不兼容的技术原因以增强说服力。
原始 PR · 作者 hubertlu-tw · 合并时间 2026-04-24 14:56
修复AMD GPU上使用默认页大小+推测解码时的内存访问错误
PR值得快速合并,是专为AMD GPU上的Triton编译器兼容性问题而设计的安全修复。建议后续为`get_last_loc_triton_safe`添加单元测试,以避免类似编译器回归。
添加LTX-2.3高质量两阶段生成流水线
建议精读 `ltx_2_denoising.py` 中的res2s采样器实现(特别是 `_ltx2_res2s_sde_step` 和 `_ltx2_stage2_res2s_step`),这是与官方HQ对齐的核心算法;同时关注 `_merge_lora_into_data` 的分组合并优化,可推广到其他LoRA场景。HQ的sigma调度和重噪声生成器设计也值得参考。
更新DeepSeek V4 H200文档中的模型仓库地址
该PR属于日常文档维护,逻辑简单,无需精读。但值得留意的是,它反映了DeepSeek V4模型部署生态的进展——sgl-project开始发布FP8重打包模型。若后续Pro FP8也更新,可快速合并。
原始 PR · 作者 wisclmy0611 · 合并时间 2026-04-24 13:10
添加DeepSeek-V4部署交互指南与命令面板
建议精读`deepseek-v4-deployment.jsx`的生成器实现,其配置驱动、严格对齐外部真实脚本的设计模式值得在后续文档中复用。同时建议在`VERIFIED_RECIPES`中记录验证状态,未来可逐渐扩大覆盖率。
原始 PR · 作者 yctseng0211 · 合并时间 2026-04-24 12:07
更新AMD CI本地Docker镜像仓库地址
该PR属于运维层面的常规更新,技术价值低,无需深入阅读。
参与讨论