执行摘要
日志增加 max_token_num 和 hidden_dim 信息
PR body 指出,服务器启动时输出的 "FlashInfer workspace initialized" 日志缺少工作区维度信息,而 max_token_num 和 hidden_dim 已在函数参数中,添加后有助于诊断 allreduce-fusion 缓冲区大小配置。
可快速合并,无需精读。
无实质讨论,reviewer 均直接批准。
PR body 指出,服务器启动时输出的 "FlashInfer workspace initialized" 日志缺少工作区维度信息,而 max_token_num 和 hidden_dim 已在函数参数中,添加后有助于诊断 allreduce-fusion 缓冲区大小配置。
可快速合并,无需精读。
无实质讨论,reviewer 均直接批准。
修改 python/sglang/srt/layers/flashinfer_comm_fusion.py 中 FlashInferWorkspaceManager.initialize 方法的日志输出行,在原有 rank、world_size、backend 之后追加 max_token_num 和 hidden_dim 的值。
| 文件 | 模块 | 状态 | 重要度 |
|---|---|---|---|
python/sglang/srt/layers/flashinfer_comm_fusion.py |
通信融合 | modified | 3.94 |
python/sglang/srt/layers/flashinfer_comm_fusion.py
core-logic
日志行变更,追加工作区维度参数
# 修改前 :
# logger.info(
# f"FlashInfer workspace initialized for rank {rank}, "
# f"world_size {world_size}, backend {backend}"
# )
# 修改后 : 追加 max_token_num 和 hidden_dim,便于启动时诊断缓冲区尺寸
backend = getattr(self.workspace, "backend", "unknown")
logger.info(
f"FlashInfer workspace initialized for rank {rank}, "
f"world_size {world_size}, backend {backend}, "
f"max_token_num {max_token_num}, hidden_dim {hidden_dim}"
)
当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。
仅修改日志字符串,无任何功能逻辑变更,无回归、性能、安全或兼容性风险。
影响极小,仅对运维人员在查看启动日志时提供更多诊断信息,用户和系统行为不受影响。
当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。
参与讨论