Prhub

#27035 docs: add DeepSeek V4 FP4 indexer usage

原始 PR 作者 liz-badada 合并时间 2026-06-04 15:44 文件变更 2 提交数 1 评论 8 代码增减 +18 / -0

执行摘要

新增 DeepSeek V4 FP4 Indexer 文档

为 DeepSeek V4 FP4 C4 Indexer 实验性功能提供用户文档,该功能用于 SM100 GPU 上 decode-heavy 长上下文场景,旨在降低 indexer 缓存带宽。

文档清晰简洁,可以直接合并。无需精读。

讨论亮点

Reviewer Fridge003 指出不应修改旧版文档 docs/advanced_features/server_arguments.md,作者已移除该改动。另外,Fridge003 建议将 Cookbook 中的标题从 "FP4 Indexer" 改为 "FP4 Indexer (Experimental)" 并在代码示例前添加 bash Command 标签,作者均予以采纳。

实现拆解

  1. 更新 Cookbook 使用指南:在 docs_new/cookbook/autoregressive/DeepSeek/DeepSeek-V4.mdx 中添加 "FP4 Indexer (Experimental)" 章节,说明参数用途、硬件要求(SM100 + DeepGEMM FP4 indexer support)和命令行示例。
  2. 更新服务端参数表:在 docs_new/docs/advanced_features/server_arguments.mdx 的配置表格中新增一行,描述 --enable-deepseek-v4-fp4-indexer 的用途、默认值(False)和类型。
  3. 移除旧文档中重复变更:根据 review 意见,删除了 docs/advanced_features/server_arguments.md 中的无关改动。
文件 模块 状态 重要度
docs_new/cookbook/autoregressive/DeepSeek/DeepSeek-V4.mdx 文档 modified 3.05
docs_new/docs/advanced_features/server_arguments.mdx 文档 modified 2.44

分析完成后,这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

移除旧文档中的变更 other

Fridge003 评论不需要更新旧的 docs/advanced_features/server_arguments.md 文件。

结论:作者移除了该文件的改动。 · 已解决

Cookbook 中标题和代码块格式修正 style

Fridge003 建议将标题从 'FP4 Indexer' 改为 'FP4 Indexer (Experimental)',并在代码示例前添加 'bash Command' 标签。

结论:作者已采纳并应用修改。 · 已解决

风险与影响

无风险。仅文档变更,不影响任何代码逻辑。

对用户而言,提供了新功能的使用说明,有助于用户了解和使用 FP4 Indexer。对系统无影响。影响范围局限于 DeepSeek V4 用户和 CUDA SM100 平台。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论