THUDM/slime
slime是面向LLM强化学习训练的后处理框架,提供高性能多模式训练和灵活数据生成能力,支持Megatron与SGLang高效集成,适配多种大模型训练需求。
语言:Python · 总 Stars:4,069 · 今日新增:+85
基于 2026-02-13 榜单,共收录 1 个与 Data & ML 相关的热门仓库。
数据处理、机器学习训练、推理与分析工具链。
slime是面向LLM强化学习训练的后处理框架,提供高性能多模式训练和灵活数据生成能力,支持Megatron与SGLang高效集成,适配多种大模型训练需求。
语言:Python · 总 Stars:4,069 · 今日新增:+85