ItsMaxNorm
/

DeepSeek-R1-Distill-SmolLM3-3B-GRPO

Text Generation

Generated from Trainer

Model card Files Files and versions

DeepSeek-R1-Distill-SmolLM3-3B-GRPO

36.9 GB

1 contributor

History: 4 commits

ItsMaxNorm's picture

End of training

2a13241 verified 5 months ago