# PR #21581 完整报告

- 仓库：`sgl-project/sglang`
- 标题：[CI] Remove Slack bot from CI failure monitor
- 合并时间：2026-04-12 11:34
- 原文链接：http://prhub.com.cn/sgl-project/sglang/pull/21581

---

# 执行摘要
此 PR 移除了 SGLang CI 失败监控中的 Slack 机器人及通知步骤，简化了工作流，使 CI 只运行失败分析并上传 JSON 报告作为 artifact。变更影响团队的通知方式，从实时 Slack 提醒转为手动检查报告，但降低了外部依赖和配置复杂性。

# 功能与动机
动机是简化 CI 失败监控流程，移除 Slack 通知以专注核心分析功能。PR body 指出“Remove Slack bot from CI failure monitor”，目标是减少不必要的步骤和依赖，使工作流更可靠和易于维护。测试计划验证工作流在移除 Slack 步骤后仍能正常运行。

# 实现拆解
- **工作流文件**：`.github/workflows/ci-failure-monitor.yml` 移除了 Slack 通知步骤（包括环境变量检查和 Python 脚本调用）和 `slack_sdk` 依赖安装，仅保留 `requests` 依赖。代码片段显示从安装 `slack_sdk` 改为仅 `requests`，并删除了整个“Send Slack Notification”作业。
- **文档更新**：`scripts/ci_monitor/README.md` 删除了 Slack 相关文档，包括工具描述、安装指南和用法示例，简化内容以仅反映失败分析功能。
- **脚本删除**：`scripts/ci_monitor/post_ci_failures_to_slack.py` 被完全移除，该脚本包含 `post_ci_failures_to_slack` 函数，负责解析 JSON 报告并发送消息到 Slack 通道。

# 评论区精华
无 review 讨论，变更直接合并，表明此清理操作无争议或需深度技术权衡。

# 风险与影响
**风险**：团队可能错过实时失败通知，需手动检查上传的 JSON 报告，可能延迟问题发现和修复。移除 `slack_sdk` 依赖可能影响其他潜在的 Slack 集成，但此脚本是唯一使用点，且依赖已从工作流中彻底移除，回归风险低。
**影响**：CI 流程简化，减少外部依赖，提升工作流稳定性和可维护性；团队需调整监控习惯，影响程度低，不涉及核心模型推理或性能优化。

# 关联脉络
此 PR 是 CI 流程优化的一部分，与近期历史 PR 如 #22608（CI 工作流重命名）和 #22228（AMD CI 超时修复）相关联，显示团队在持续改进基础设施配置和测试可靠性。这些变更共同指向减少外部依赖、简化工作流和提升 CI 效率的趋势。