执行摘要

简化 running_batch 和 running_mbs 的条件守卫

移除冗余的 hasattr 守卫，因为 running_batch 始终在 Scheduler.__init__ 中创建，而 running_mbs 在 PP 模式下通过 init_pp_loop_state 保证在读取前已初始化。hasattr 的存在不仅多余，而且隐式地充当了“是否处于 PP 模式”的代理，不如直接检查 pp_size > 1 语义清晰。

建议快速合并。该 PR 是机械重构的一个安全示例，适合作为代码阅读的参考，但不需要精读。

讨论亮点

该 PR 无 reviewer 评论，且仅由作者自己合并，表明变更为公认的小型机械重构，无需深入讨论。

实现拆解

在 python/sglang/srt/observability/scheduler_metrics_mixin.py 的 update_lora_metrics 方法中，将 PP 模式分支的条件从 if hasattr(self, "running_mbs") and self.running_mbs: 改为 if self.server_args.pp_size > 1:。
将普通模式分支的条件从 elif hasattr(self, "running_batch") and self.running_batch: 改为 elif self.running_batch:。
未引入其他变动，变更仅涉及 2 行删除和 2 行新增。

文件	模块	状态	重要度
`python/sglang/srt/observability/scheduler_metrics_mixin.py`	观测	modified	4.48

关键符号

update_lora_metrics

关键源码片段

python/sglang/srt/observability/scheduler_metrics_mixin.py core-logic

唯一变更文件，修改了 LoRA 指标采集方法中的条件守卫。

def update_lora_metrics(self: Scheduler):
    """Update LoRA pool metrics for monitoring and autoscaling."""
    if not self.enable_lora:
        return

    try:
        lora_manager = self.tp_worker.model_runner.lora_manager
        if lora_manager is None or lora_manager.memory_pool is None:
            return

        mem_pool = lora_manager.memory_pool
        slots_total = mem_pool.max_loras_per_batch

        active_lora_ids = set()

        # For PP mode, check all running micro batches
        # running_mbs is guaranteed to be initialized by init_pp_loop_state
        # in PP mode before this is ever called.
        if self.server_args.pp_size > 1:
            for batch in self.running_mbs:
                if batch and hasattr(batch, "reqs"):
                    for req in batch.reqs:
                        if hasattr(req, "lora_id") and req.lora_id is not None:
                            active_lora_ids.add(req.lora_id)
        # For normal mode, check running_batch
        # running_batch is always created in Scheduler.__init__
        elif self.running_batch:
            if hasattr(self.running_batch, "reqs"):
                for req in self.running_batch.reqs:
                    if hasattr(req, "lora_id") and req.lora_id is not None:
                        active_lora_ids.add(req.lora_id)

        slots_used = len(active_lora_ids)
        utilization = slots_used / slots_total if slots_total > 0 else 0.0

        self.stats.lora_pool_slots_used = slots_used
        self.stats.lora_pool_slots_total = slots_total
        self.stats.lora_pool_utilization = utilization

    except Exception as e:
        logger.warning(f"Failed to update LoRA metrics: {e}")

评论区精华

没有提炼出高价值讨论线程

当前评论区没有形成足够清晰的争议点或结论，后续有更多讨论时会体现在这里。

风险与影响

风险较低：running_batch 和 running_mbs 的初始化时机在代码结构中已有保证，但若未来有人改变初始化逻辑（例如延迟初始化 running_batch），则直接访问可能导致 AttributeError。当前 hasattr 的移除依赖于 Scheduler.__init__ 和 init_pp_loop_state 的现有实现，这些实现被视作不变前提。

影响范围限于 update_lora_metrics 一处逻辑，无外部可见行为变化。代码语义更清晰，维护性略微提升。

依赖初始化时机

关联 Issue

未识别关联 Issue

当前没有检测到明确关联的 Issue 链接，后续同步到相关引用后会出现在这里。

完整报告

执行摘要

一句话：简化 running_batch 和 running_mbs 的条件守卫
推荐动作：建议快速合并。该 PR 是机械重构的一个安全示例，适合作为代码阅读的参考，但不需要精读。

功能与动机

实现拆解

在 python/sglang/srt/observability/scheduler_metrics_mixin.py 的 update_lora_metrics 方法中，将 PP 模式分支的条件从 if hasattr(self, "running_mbs") and self.running_mbs: 改为 if self.server_args.pp_size > 1:。
将普通模式分支的条件从 elif hasattr(self, "running_batch") and self.running_batch: 改为 elif self.running_batch:。
未引入其他变动，变更仅涉及 2 行删除和 2 行新增。

关键文件：

python/sglang/srt/observability/scheduler_metrics_mixin.py（模块观测；类别 source；类型 core-logic；符号 update_lora_metrics）: 唯一变更文件，修改了 LoRA 指标采集方法中的条件守卫。

关键符号：update_lora_metrics

关键源码片段

`python/sglang/srt/observability/scheduler_metrics_mixin.py`

唯一变更文件，修改了 LoRA 指标采集方法中的条件守卫。

def update_lora_metrics(self: Scheduler):
    """Update LoRA pool metrics for monitoring and autoscaling."""
    if not self.enable_lora:
        return

    try:
        lora_manager = self.tp_worker.model_runner.lora_manager
        if lora_manager is None or lora_manager.memory_pool is None:
            return

        mem_pool = lora_manager.memory_pool
        slots_total = mem_pool.max_loras_per_batch

        active_lora_ids = set()

        # For PP mode, check all running micro batches
        # running_mbs is guaranteed to be initialized by init_pp_loop_state
        # in PP mode before this is ever called.
        if self.server_args.pp_size > 1:
            for batch in self.running_mbs:
                if batch and hasattr(batch, "reqs"):
                    for req in batch.reqs:
                        if hasattr(req, "lora_id") and req.lora_id is not None:
                            active_lora_ids.add(req.lora_id)
        # For normal mode, check running_batch
        # running_batch is always created in Scheduler.__init__
        elif self.running_batch:
            if hasattr(self.running_batch, "reqs"):
                for req in self.running_batch.reqs:
                    if hasattr(req, "lora_id") and req.lora_id is not None:
                        active_lora_ids.add(req.lora_id)

        slots_used = len(active_lora_ids)
        utilization = slots_used / slots_total if slots_total > 0 else 0.0

        self.stats.lora_pool_slots_used = slots_used
        self.stats.lora_pool_slots_total = slots_total
        self.stats.lora_pool_utilization = utilization

    except Exception as e:
        logger.warning(f"Failed to update LoRA metrics: {e}")

评论区精华

该 PR 无 reviewer 评论，且仅由作者自己合并，表明变更为公认的小型机械重构，无需深入讨论。

暂无高价值评论线程

风险与影响

风险：风险较低：running_batch 和 running_mbs 的初始化时机在代码结构中已有保证，但若未来有人改变初始化逻辑（例如延迟初始化 running_batch），则直接访问可能导致 AttributeError。当前 hasattr 的移除依赖于 Scheduler.__init__ 和 init_pp_loop_state 的现有实现，这些实现被视作不变前提。
影响：影响范围限于 update_lora_metrics 一处逻辑，无外部可见行为变化。代码语义更清晰，维护性略微提升。
风险标记：依赖初始化时机

关联脉络

暂无明显关联 PR

#25439 Lift running_batch / running_mbs access — direct + PP-explicit

执行摘要

简化 running_batch 和 running_mbs 的条件守卫

实现拆解

评论区精华

没有提炼出高价值讨论线程

风险与影响

关联 Issue

未识别关联 Issue

完整报告

执行摘要

功能与动机

实现拆解

关键源码片段

`python/sglang/srt/observability/scheduler_metrics_mixin.py`

评论区精华

风险与影响

关联脉络

参与讨论