Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

274

Full-text search

Active filters: kto

Aaryan-Nakhat/experiment_117_RL_itr_4_on_exp_105_model_v2

Text Generation • 3B • Updated Sep 30, 2025 • 2

Aaryan-Nakhat/experiment_119_RL_itr_4_on_exp_105_model_v2

Text Generation • 3B • Updated Sep 30, 2025 • 1

WokeAI/tankie-kto-v1-adpt

Text Generation • Updated Oct 26, 2025

AIPlans/Qwen3-0.6B-KTO_trial

Text Generation • 0.6B • Updated Nov 10, 2025 • 2 • 1

ucrelnlp/PyMUSAS-Neural-Multilingual-Small-BEM

Updated Jan 19 • 14

ucrelnlp/PyMUSAS-Neural-Multilingual-Base-BEM

Updated Jan 19 • 58 • 1

karim12344321/llama2-7b-kto-mental-health_final

Text Generation • Updated Dec 2, 2025

onnx-community/mmBERT-small-ONNX

Fill-Mask • Updated Dec 14, 2025 • 11 • 2

developer-lunark/doha-kto

4B • Updated Dec 24, 2025 • 2

developer-lunark/ian-kto

4B • Updated Dec 24, 2025

developer-lunark/min-kto

4B • Updated Dec 24, 2025 • 3

developer-lunark/jihu-kto

4B • Updated Dec 24, 2025

developer-lunark/yul-kto

4B • Updated Dec 24, 2025

mradermacher/yul-kto-GGUF

4B • Updated Dec 24, 2025 • 214

mradermacher/yul-kto-i1-GGUF

4B • Updated Dec 24, 2025 • 21

Nishef/MiniCPM-1B-sft-bf16-Full_KTO_20251225_185339

Text Generation • Updated Jan 8

Nishef/Qwen3-0.6B-Full_DPO_20251225_130318

Text Generation • Updated Jan 8

Nishef/Qwen3-0.6B-Full_KTO_20251225_102050

Text Generation • Updated Jan 8

Nishef/Qwen3-0.6B-Full_ORPO_20251225_145426

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_DPO_20251225_043457

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_KTO_20251225_020028

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_ORPO_20251225_062447

Text Generation • Updated Jan 8

Nishef/SmolLM2-360M-Full_KTO_20251225_020028-merged

Text Generation • 0.4B • Updated Jan 8 • 11

Nishef/SmolLM2-360M-Full_DPO_20251225_043457-merged

Text Generation • 0.4B • Updated Jan 8 • 1

Nishef/SmolLM2-360M-Full_ORPO_20251225_062447-merged

Text Generation • 0.4B • Updated Jan 8 • 7

Nishef/Qwen3-0.6B-Full_KTO_20251225_102050-merged

Text Generation • 0.6B • Updated Jan 8 • 3

Nishef/Qwen3-0.6B-Full_DPO_20251225_130318-merged

Text Generation • 0.6B • Updated Jan 8 • 36

Nishef/Qwen3-0.6B-Full_ORPO_20251225_145426-merged

Text Generation • 0.6B • Updated Jan 8 • 2

Nishef/MiniCPM-1B-sft-bf16-Full_KTO_20251225_185339-merged

Text Generation • 1B • Updated Jan 8 • 1

Nishef/SmolLM2-360M-Full_KNOWLEDGE_RETAINING_ENHANCED_KTO_20251227_151509

Text Generation • Updated Dec 27, 2025 • 17