重构
重要性 5.68
洞察度 5.00
将 DSA MQA logits 空闲内存比例改为可配置
本 PR 改动较小且逻辑清晰,值得关注的点是环境变量配置的运行时动态性设计(通过静态方法而非类属性获取)以及 NSA→DSA 重命名策略。建议精读 `dsa_indexer.py` 中的 `_get_mqa_logits_budget_bytes` 方法,理解预算计算流程。对于维护者,建议补充环境变量的文档说明。
标签列表
聚合结果
将 DSA MQA logits 空闲内存比例改为可配置
本 PR 改动较小且逻辑清晰,值得关注的点是环境变量配置的运行时动态性设计(通过静态方法而非类属性获取)以及 NSA→DSA 重命名策略。建议精读 `dsa_indexer.py` 中的 `_get_mqa_logits_budget_bytes` 方法,理解预算计算流程。对于维护者,建议补充环境变量的文档说明。
修复 Mamba LRU 链表节点引用循环内存泄漏
建议合并。该 PR 定位精准、修复简洁、验证充分,属于典型的高收益低风险修复。值得学习的是其系统性的诊断方法(malloc_trim、gc.collect、DEBUG_SAVEALL)和 reviewer 提醒的统一修复范围。