Prhub

#26605 [Log] include max_token_num and hidden_dim in FlashInfer workspace init log

原始 PR 作者 kpham-sgl 合并时间 2026-06-02 04:26 文件变更 1 提交数 2 评论 3 代码增减 +2 / -1

执行摘要

日志增加 max_token_num 和 hidden_dim 信息

PR body 指出,服务器启动时输出的 "FlashInfer workspace initialized" 日志缺少工作区维度信息,而 max_token_num 和 hidden_dim 已在函数参数中,添加后有助于诊断 allreduce-fusion 缓冲区大小配置。

可快速合并,无需精读。

讨论亮点

无实质讨论,reviewer 均直接批准。

实现拆解

修改 python/sglang/srt/layers/flashinfer_comm_fusion.pyFlashInferWorkspaceManager.initialize 方法的日志输出行,在原有 rankworld_sizebackend 之后追加 max_token_numhidden_dim 的值。

文件 模块 状态 重要度
python/sglang/srt/layers/flashinfer_comm_fusion.py 通信融合 modified 3.94

关键源码片段

python/sglang/srt/layers/flashinfer_comm_fusion.py core-logic

日志行变更,追加工作区维度参数

# 修改前 :
# logger.info(
# f"FlashInfer workspace initialized for rank {rank}, "
# f"world_size {world_size}, backend {backend}"
# )# 修改后 : 追加 max_token_num 和 hidden_dim,便于启动时诊断缓冲区尺寸
backend = getattr(self.workspace, "backend", "unknown")
logger.info(
    f"FlashInfer workspace initialized for rank {rank}, "
    f"world_size {world_size}, backend {backend}, "
    f"max_token_num {max_token_num}, hidden_dim {hidden_dim}"
)

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。

风险与影响

仅修改日志字符串,无任何功能逻辑变更,无回归、性能、安全或兼容性风险。

影响极小,仅对运维人员在查看启动日志时提供更多诊断信息,用户和系统行为不受影响。

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。

完整报告

参与讨论