执行摘要
gzip 压缩级别从 1 降为 0,加速 RGB 传输
PR body明确指出,需要避免在实时CPU预算内压缩已经无损的帧负载('avoid spending realtime CPU budget compressing already lossless frame payloads'),以加速实时RGB传输。
该PR变更简洁高效,性能收益显著且风险可控。值得精读以了解实时传输场景下的性能优化思路。
PR无review评论,仅两个bot评论(配额限制和CI重跑指令),无技术讨论。
PR body明确指出,需要避免在实时CPU预算内压缩已经无损的帧负载('avoid spending realtime CPU budget compressing already lossless frame payloads'),以加速实时RGB传输。
该PR变更简洁高效,性能收益显著且风险可控。值得精读以了解实时传输场景下的性能优化思路。
PR无review评论,仅两个bot评论(配额限制和CI重跑指令),无技术讨论。
python/sglang/multimodal_gen/runtime/utils/realtime_video.py中新增模块级常量_RAW_RGB_DELTA_GZIP_LEVEL = 0(第30行)。build_delta_gzip_raw_rgb_payload函数中,将zlib.compressobj的level参数由字面量1改为引用该常量(第51-53行),使压缩级别降为0(仅存储/不压缩)。| 文件 | 模块 | 状态 | 重要度 |
|---|---|---|---|
python/sglang/multimodal_gen/runtime/utils/realtime_video.py |
多模态生成 | modified | 5.31 |
python/sglang/multimodal_gen/runtime/utils/realtime_video.py
core-logic
核心变更文件:新增常量 `_RAW_RGB_DELTA_GZIP_LEVEL = 0`,并替换 `zlib.compressobj` 的压缩级别参数,实现性能优化。
# 定义 gzip 压缩级别为 0(仅存储,不压缩),
# 避免在实时 CPU 预算内对已无损的帧负载进行压缩。
_RAW_RGB_DELTA_GZIP_LEVEL = 0
def build_delta_gzip_raw_rgb_payload(
frames: list[bytes],
*,
reference_frame: bytes | None = None,
) -> bytes:
# ... 前置校验 ...
previous = (
np.frombuffer(reference_frame, dtype=np.uint8)
if reference_frame is not None
else None
)
# 使用 level=0 保持 gzip 帧格式,但不进行实际压缩,
# 从而在保留无损传输能力的同时大幅降低 CPU 开销。
compressor = zlib.compressobj(
level=_RAW_RGB_DELTA_GZIP_LEVEL, method=zlib.DEFLATED, wbits=31
)
compressed_chunks = []
for frame in frames:
# ... delta 计算与压缩逻辑 ...
当前评论区没有形成足够清晰的争议点或结论,后续有更多讨论时会体现在这里。
restore_delta_gzip_raw_rgb_payload使用zlib.decompress,gzip格式(wbits=31)保持不变,仅压缩级别降为0,因此接收端无需任何修改,可以正确解压。当前没有检测到明确关联的 Issue 链接,后续同步到相关引用后会出现在这里。
参与讨论