#44388 [Doc] Update ViT CUDA graph interfaces
原始 PR · 作者 shen-shanshan · 合并时间 2026-06-03 16:21
更新 ViT CUDA 图文档,同步代码变更
此 PR 是纯粹的文档同步更新,对大多数工程师无需精读。但若您正在使用或开发 ViT CUDA 图系统,建议查看此文档以了解最新的 API 和流程。
标签列表
聚合结果
原始 PR · 作者 shen-shanshan · 合并时间 2026-06-03 16:21
更新 ViT CUDA 图文档,同步代码变更
此 PR 是纯粹的文档同步更新,对大多数工程师无需精读。但若您正在使用或开发 ViT CUDA 图系统,建议查看此文档以了解最新的 API 和流程。
为 FS Tier Manager 添加跨进程共享文档
此 PR 为小范围文档改进,理解价值有限。但其中关于 `PYTHONHASHSEED` 的说明对于理解 vLLM 跨实例 KV 缓存共享机制有参考意义。
原始 PR · 作者 DaoyuanLi2816 · 合并时间 2026-06-03 08:22
移除死环境变量并修正文档
此 PR 展示了如何安全清理死代码和同步文档,适用于类似的遗留清理任务。
在基准测试中支持客户端侧图像编码
值得精读,特别是如何复用 `vllm.multimodal.utils` 中的工具实现客户端编码,以及如何在不破坏现有行为的前提下逐步添加特性。设计决策清晰,适合作为多模态基准测试扩展的参考。
将开发模式入口点统一移至 dev/ 目录
该 PR 是良好的代码组织重构示例,值得阅读以理解如何通过分离职责来模块化入口点。建议在代码审查中关注 `register_vllm_dev_api_routers` 的设计以及文件移动后的导入更新,确保没有遗留的硬编码路径。
新增 JetBrains Mellum v2 代码生成模型支持
该 PR 结构清晰、改动集中,适合作为新模型支持的标准参考。建议简要浏览实现文件,了解 vLLM 添加新模型时需修改的注册点(registry.py、configs/__init__.py、config.py)。
修复文档和示例中的失效视频链接
该 PR 价值较低但属于必要的维护工作。建议在日常文档维护中关注 URL 有效性,或引入自动化链接检查。
原始 PR · 作者 nightcityblade · 合并时间 2026-06-01 03:28
修复 MLA attention docstring 示例错误
该 PR 属于纯文档修正,变更简单明确,无需深度阅读。但可视为文档质量改进的典范:通过 issue 驱动,精准修复,测试验证。