#37485 [Perf] Disable inductor runtime asserts by default for serving perfor…
原始 PR · 作者 tianrengao · 合并时间 2026-03-25 07:37
默认禁用 Inductor 运行时断言,以降低大模型前向传播的2ms开销。
该 PR 值得精读,因为它展示了在性能和调试之间的设计权衡,以及如何通过配置和环境变量提供灵活性。建议关注 __post_init__ 中的版本检查和日志级别绑定逻辑,以及测试用例的设计。
参与讨论