#22471 [Spec][Ngram] Return token counts in list_external_corpora API
作者 kpham-sgl · 合并时间 2026-04-11 12:50
将list_external_corpora API返回值扩展为包含语料库token计数的字典。
建议关注此PR的设计决策,如使用制表符分隔符避免corpus ID中的逗号问题,以及从C++到HTTP的全栈一致性更新。对于从事Ngram模块或API开发的工程师值得精读,以理解外部语料库管理的演进方向。
参与讨论