Prhub

#26249 [hisparse]: update user guide

原始 PR 作者 hzh0425 合并时间 2026-05-25 17:54 文件变更 2 提交数 4 评论 3 代码增减 +24 / -22

执行摘要

更新 HiSparse 用户指南,支持 DeepSeek V4

为 HiSparse 特性补充 DeepSeek V4 的支持说明,并更新启动参数以反映实际配置要求。

建议合并;但后续应确保仅维护单一文档源(docs_new),避免未来再次出现不一致。

讨论亮点

评论中,zijiexia 提醒文档已迁移至 docs_new 目录,作者 hzh0425 随后同步更新了 docs_new 下的文档。

实现拆解

  1. 更新前提条件:在两份文档中,将模型支持从「仅 DSA 架构(如 DeepSeek-V3.2, GLM-5)」扩展到「DSA 架构和 DeepSeek V4」。
  2. 补充 DeepSeek V4 传输细节:新增说明——对于 DeepSeek V4,Direct-to-Host 路径只写入 C4 KV,c4_indexer 和 C128 KV 保持设备到设备传输。
  3. 修订启动示例:移除 --kv-cache-dtype bfloat16--dsa-decode-backend flashmla_sparse 参数,改为 --disable-radix-cache;新增 Note 解释 KV dtype 自动选择逻辑和 DSA 后端自动选择机制。
  4. 移除过时关键说明:删除显式声明要求 --kv-cache-dtype bfloat16--dsa-decode-backend flashmla_sparse 的条目,因为现在已支持自动选择。
文件 模块 状态 重要度
docs_new/docs/advanced_features/hisparse_guide.mdx 用户文档 modified 3.26
docs/advanced_features/hisparse_guide.md 用户文档 modified 2.44

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

文档更新本身无技术风险,但需确保同步两份文档的一致性,避免用户参考旧版文档时得到过时信息。

对系统无直接影响;用户能通过更新后的文档正确配置 HiSparse 以支持 DeepSeek V4 和 DSA 模型。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论