#29947 [Frontend] OpenAI Responses API supports Tool/Function calling with streaming

原始 PR 作者 chaunceyjiang 合并时间 2026-03-12 15:03 文件变更 3 提交数 12 评论 17 代码增减 +348 / -20

执行摘要

为 OpenAI Responses API 添加流式工具 / 函数调用支持。

从Issue评论中，多个用户（如loganlebanoff、Dorsivan、SaltFish11）表达了对此功能的强烈期待，表明这是提升用户体验和API完整性的重要需求。PR body中提供了测试代码示例，旨在模拟OpenAI的流式工具调用场景，确保API兼容性和功能性。

该PR值得精读，特别是_process_simple_streaming_events函数中的工具解析集成设计，展示了如何在现有流式框架中优雅地扩展新功能，同时关注测试组织和未来重构的权衡。

讨论亮点

reviewer qandrew提出了几个关键点：

建议将测试逻辑移动到tests/entrypoints/openai/responses/test_simple.py，但作者回应当前vllm serve在该文件中未启用tool-calling，同意稍后重构。
要求在测试中添加断言验证tool_call_item与response.completed_event.function_tool_call的匹配，作者已处理（回复'Done.'）。
非阻塞意见：未来可能将逻辑移到Parser中以支持更灵活的序列（如工具调用在推理之前）。讨论以友好方式结束，无重大争议。

实现拆解

实现主要集中在三个文件：

vllm/entrypoints/openai/responses/serving.py：修改_process_simple_streaming_events函数，添加tool_parser处理工具调用的流式解析，类似于已有的reasoning_parser，并新增事件类型如ResponseFunctionCallArgumentsDeltaEvent。
tests/v1/entrypoints/openai/serving_responses/test_function_call.py：新增两个测试函数（test_function_calling_with_streaming_expected_arguments和test_function_calling_with_streaming_types），验证流式工具调用的参数和事件类型。
tests/entrypoints/openai/test_serving_responses.py：更新mock parser以支持extract_tool_calls_streaming方法，确保测试环境兼容。

文件	模块	状态	重要度
`vllm/entrypoints/openai/responses/serving.py`	frontend/serving	modified	8.0
`tests/v1/entrypoints/openai/serving_responses/test_function_call.py`	testing	modified	6.0
`tests/entrypoints/openai/test_serving_responses.py`	testing	modified	4.0

关键符号

_process_simple_streaming_events extract_tool_calls_streaming

分析完成后，这里会展示 LLM 生成的相对完整源码片段和详细注释。

评论区精华

测试文件组织 设计

qandrew 建议将测试逻辑移动到统一文件 test_simple.py，但作者回应当前配置限制（vllm serve 未启用 tool-calling），同意稍后重构。

结论：暂不移动，等待后续重构，双方达成一致。 · 已解决

测试断言添加 正确性

qandrew 建议在测试中添加断言，验证 tool_call_item 与 response.completed_event.function_tool_call 的匹配。

结论：作者已添加断言，确保测试覆盖完整性。 · 已解决

未来重构可能性 设计

qandrew 提出非阻塞意见，未来可能将逻辑移到 Parser 中以支持更灵活的序列（如工具调用在推理之前）。

结论：留待未来考虑，未在本 PR 中解决。 · pending

风险与影响

技术风险包括：新增工具解析器逻辑可能影响现有流式推理逻辑的稳定性，尤其在_process_simple_streaming_events函数中集成；新增事件类型需要确保与OpenAI API规范完全兼容，否则可能导致客户端解析错误；工具调用参数解析（如Issue评论中提到的无输入参数情况）可能引发验证错误，需进一步测试覆盖。

对用户：提供了流式工具调用功能，增强了OpenAI Responses API的实用性和兼容性，支持更自然的交互场景。对系统：扩展了前端服务层，增加了代码复杂度，但通过新增测试用例进行了验证。对团队：需要维护新增的逻辑和事件处理，但设计上复用了现有parser架构，有利于代码一致性。

新功能集成 API 兼容性

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

该PR实现了OpenAI Responses API对流式工具/函数调用的支持，通过在前端服务层集成工具解析器逻辑，新增相关事件类型和测试用例。这是一个有意义的改进，增强了API兼容性和用户体验，风险主要在新功能集成和API规范匹配上，值得精读以了解流式框架的扩展设计。

功能与动机

该PR旨在扩展OpenAI Responses API的功能，使其在流式模式下支持工具调用。从Issue评论中，多个用户（如loganlebanoff、Dorsivan、SaltFish11）表示“really looking forward to this feature”，说明这是用户驱动的需求，旨在提升API的完整性和交互性。PR body中提供了测试代码示例，模拟OpenAI官方API的流式工具调用场景，确保实现兼容性。

实现拆解

关键改动集中在以下文件：

vllm/entrypoints/openai/responses/serving.py：修改_process_simple_streaming_events函数，添加tool_parser处理工具调用的流式解析。代码逻辑类似于已有的reasoning_parser，新增事件类型如ResponseFunctionCallArgumentsDeltaEvent。例如：

if reasoning_ended:
    if not tool_call_text_started:
        tool_call_text_started = True
        previous_text = ""
        previous_token_ids = []
    delta_message = tool_parser.extract_tool_calls_streaming(...)

tests/v1/entrypoints/openai/serving_responses/test_function_call.py：新增两个测试函数：test_function_calling_with_streaming_expected_arguments验证工具调用参数，test_function_calling_with_streaming_types验证事件类型配对。
tests/entrypoints/openai/test_serving_responses.py：更新mock parser，添加extract_tool_calls_streaming方法以支持测试。

评论区精华

review讨论中，qandrew提出以下几点：

测试组织：建议将测试逻辑移动到test_simple.py，作者解释当前vllm serve未启用tool-calling，同意稍后重构。
断言添加：要求验证工具调用项与完成事件的匹配，作者回复“Done.”，已处理。
未来设计：提出非阻塞意见，“maybe in the future models would want that with interleaved reasoning etc”，建议未来将逻辑移到Parser中以支持更灵活序列。
讨论以友好方式结束，无重大争议，突出了测试策略和未来可扩展性的权衡。

风险与影响

风险分析：新增工具解析器可能影响现有流式推理逻辑的稳定性，特别是在_process_simple_streaming_events函数中的集成点。新增事件类型需严格匹配OpenAI API规范，否则可能导致客户端解析错误。Issue评论中用户SaltFish11报告了事件类型不匹配问题，显示兼容性风险。工具调用参数解析（如无输入参数情况）可能引发验证错误，需额外测试覆盖。
影响分析：对用户而言，提供了实用的流式工具调用功能，增强API吸引力。对系统，扩展了前端服务层，增加了少量代码复杂度，但通过测试进行了验证。对团队，需要维护新逻辑，但设计上复用了现有架构，有利于代码一致性。

关联脉络

从历史PR分析看，该PR与近期工具调用相关PR（如#39027和#39114）形成功能线，都集中在工具调用和前端处理上。这表明团队正持续改进工具调用功能，特别是流式支持。未来可能涉及更复杂的序列处理（如推理与工具调用交错），该PR为后续扩展奠定了基础。

#29947 [Frontend] OpenAI Responses API supports Tool/Function calling with streaming

执行摘要

为 OpenAI Responses API 添加流式工具 / 函数调用支持。

实现拆解

评论区精华

风险与影响

关联 Issue

未识别关联 Issue

完整报告

参与讨论