#35809 [Models] Cohere Transcribe
原始 PR · 作者 ekagra-ranjan · 合并时间 2026-03-18 05:04
添加 Cohere ASR 语音转录模型支持,扩展 vLLM 多模态能力。
建议技术管理者和工程师精读此 PR,重点关注: 1. **模型实现**:`cohere_asr.py` 中的编码器-解码器架构设计,特别是与变长编码器集成的部分。 2. **设计决策**:`skip_decoder_start_token` 标志的引入和传播方式,体现了非侵入式扩展模式,值得借鉴。 3. **Review 洞察**:讨论中的设备处理和代码共享权衡,可帮助避免类似硬编码陷阱。 4. **关联变更**:结合 PR 31058 等历史变长编码器改进,理解整体架构演进。
参与讨论