-
Notifications
You must be signed in to change notification settings - Fork 830
Open
Labels
Description
模型
- ✅最新模型接入 P0
- Omni pending
a. 部署支持输出音频
b. 支持talker的训练 - All-to-All优化 pending
- ✅embedding: 支持推理、部署
- ✅reranker训练支持
a. 推理部署支持 - 序列分类: 多标签/回归支持量化
训练
- RAY支持 P0
- ✅长文本ring attention
- ✅AutoTP P0
- ✅channel loss支持packing/padding_free
- ✅多模态packing优化
- ✅new_special_tokens支持
- 多模态packing/padding_free支持更多模型
- 混合模态训练支持更多模态
- ✅flash-attention-3
Megatron-SWIFT
- 新模型支持
a. 多模态: qwen2.5-VL/qwen2.5-Omni P0
b. ✅DeepSeekV3
c. Llama4 - ✅fp8
a. blockwise fp8 P0 - ✅LoRA支持
- ✅支持提前预处理数据集
- RLHF支持 P0
a. GRPO
b. KTO
c. ✅DPO - ✅bshd格式支持
- swanlab支持 P0
- ✅loss_scale支持
- 分类/Embedding模型支持
- Deepspeed集成
RL
- GRPO
a. ✅多轮AsyncEngine
b. Agent MCP
c. sglang
d. 效率对比benchmark
e. ✅多机rollout
f. ✅GSPO
g. ✅DeepEyes - ✅MPO
- ✅GKD
- RLOO P1
- Reinforce++ P0
7.多模态PPO - KTO padding_free支持
- RM 支持 pointwise 训练 P0
推理与部署
- ✅sglang接入推理部署
a. 多模态模型 - vLLM支持分类模型和RM
量化导出
- ✅fp8/bnb支持多模态模型
- ✅qlora支持merge-lora P1
- ✅fp8量化