Prhub
← 返回仓库详情

标签聚合

THUDM/slime · 标签视图

标签列表

聚合结果

feature 相关 PR

2026-04-15

#1834 docs: add Relax to notable projects in README

作者 Yangruipis · 合并时间 2026-04-15 13:48

文档 重要性 1.89 洞察度 1.00

在README的知名项目列表中添加Relax异步RL引擎条目。

docs configuration feature

该PR变更简单,无需精读。对于想了解slime生态应用或Relax项目的读者,可快速浏览新增条目。无复杂设计决策需要关注。

2026-04-07

#1812 feat: add support for including missing weights from origin HF checkp…

作者 peterjc123 · 合并时间 2026-04-07 14:56

功能 重要性 5.00 洞察度 4.00

在权重转换工具中添加从原始HF检查点补充缺失权重的功能,提升Qwen3.5模型转换完整性。

feature configuration multimodal

该PR值得关注其设计思路:通过维护已转换权重名称集合和从原始检查点补充缺失项的方式,优雅地解决了部分权重转换问题。建议精读save_tensors函数中新增的权重补充逻辑,理解其如何保持转换完整性同时避免重复。

#1750 feat: add npu patch for qwen3-vl-8b grpo & ppo

作者 cjy0x · 合并时间 2026-04-07 11:19

功能 重要性 7.00 洞察度 5.00

添加NPU补丁以支持Qwen3-VL-8B模型的GRPO和PPO训练。

feature configuration docker multimodal

该PR值得精读,特别是对于涉及硬件适配或多模态训练的工程师。重点关注: 1. `slime.patch`中的资源分配逻辑变更,如Ray API替换,这可能影响分布式训练稳定性。 2. 补丁中的手动代码替换(如cuda→npu),需理解其背后的兼容性设计决策。 3. 环境配置和版本依赖,以评估部署可行性。建议结合README.md进行实操验证。

2026-04-05

#1805 sync from internal

作者 zhuzilin · 合并时间 2026-04-05 10:27

功能 重要性 7.00 洞察度 6.00

同步内部代码,优化多模态模型支持和 SGLang rollout 数据并行平衡。

bugfix feature multimodal performance

建议工程师精读以下部分: - slime/backends/megatron_utils/model_provider.py 中的可调用 spec 处理,了解如何扩展模型支持以适配新架构。 - slime/rollout/sglang_rollout.py 的 dp_rank_context 实现,学习负载均衡设计模式。 关注风险点,确保在测试环境中验证新功能,并考虑补充相关单元测试。

2026-04-03

#1764 Add host memory metrics to available_memory function

作者 peterjc123 · 合并时间 2026-04-03 11:52

功能 重要性 4.00 洞察度 3.00

在内存监控函数中添加主机内存指标,增强系统资源可见性。

metrics configuration feature

该PR值得快速浏览以了解内存监控功能的扩展。关注点包括:新增依赖的管理、字段命名的一致性,以及是否需要在其他工具(如日志或指标收集)中集成这些新指标。对于涉及资源监控的开发者,此变更提供了有用的参考。

2026-03-29

#1769 Support FP8 conversion for Qwen3.5

作者 peterjc123 · 合并时间 2026-03-29 13:45

功能 重要性 5.00 洞察度 3.00

为 Qwen3.5 模型添加 FP8 转换支持,通过过滤特定权重键名。

feature performance configuration

建议快速浏览此 PR 以了解 FP8 转换脚本的更新,重点关注新增的过滤条件是否覆盖了 Qwen3.5 模型的所有相关权重。对于维护类似转换逻辑或处理模型适配的工程师,可参考此变更来设计对其他模型的扩展。

#1776 Add rollout trace timeline viewer

作者 zhuzilin · 合并时间 2026-03-29 01:16

功能 重要性 6.00 洞察度 6.00

新增rollout trace时间线查看器,支持离线分析SGLang生成和奖励模型span事件。

feature docs metrics

此PR值得精读,特别是对于关注调试、性能优化和SGLang集成的工程师。值得关注的设计决策包括trace span上下文管理、PD时间分解的可视化处理,以及模块化工具设计,这些展示了优雅的代码组织方式。

2026-03-27

#1760 [Multimodal] Add Multimodal OPD support

作者 coding-famer · 合并时间 2026-03-27 15:44

功能 重要性 5.00 洞察度 3.00

为on-policy distillation添加多模态输入支持,使VLMs能够处理图像数据。

multimodal feature

对于使用多模态蒸馏或计划集成VLMs的用户,此PR值得精读,以了解图像数据如何集成到蒸馏流程中。对于其他用户,变更较小,可快速浏览以保持对系统功能的了解。设计决策简单,主要关注向后兼容性和最小化侵入性,值得关注如何处理条件性数据添加。