Prhub

vllm-project/vllm · 标签视图

标签列表

聚合结果

sampling 相关 PR

2026-05-02
功能 重要性 7.97 洞察度 6.00

添加 logprob_token_ids 支持到 V2 模型 Runner

值得精读,特别是 `compute_topk_logprobs` 的 fast/slow path 设计和 `_fill_logprob_token_ids_kernel` 的实现。njhill 的重构也体现了模块化原则。也可以关注 `gemini-code-assist` 的自动化 review 质量。