执行摘要
通过锁定 nixl-cu12 和 nixl-cu13 版本来修复 PD CI 中断问题。
PR body中说明:'nixl-cu12==1.0.1 dropped on PyPI today (19:38 UTC) and ships nixl_ep compiled against libcudart.so.12 — crashes on CUDA 13 CI runners.' 现有约束'< 0.10.0'只锁定元包,未锁定后端,因此需要显式添加后端版本约束以防止崩溃。
建议快速审阅此PR以了解CI依赖管理中的临时修复策略。关注review中讨论的依赖设计权衡,以及如何避免类似问题在未来发生。
review中主要争议点:添加nixl-cu12作为全局要求是否合适。gemini-code-assist[bot]指出:'Adding nixl-cu12 as a direct requirement forces its installation on all systems ... where it is unnecessary and adds significant bloat (100MB+).' NickLucche回应:'I'm also not super happy with having to install both like this.' cjackal提出了一个替代方案:安装特定变体并使用--no-deps选项。最终PR被批准以快速解封CI,但环境臃肿问题未解决。
参与讨论