Edit Models filters

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

arxiv: 2410.17215

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Mixture of Experts

Carbon Emissions

Models

32

Full-text search

Active filters: 2410.17215

MiniLLM/MiniPLM-Qwen-1.2B

Text Generation • 1B • Updated Mar 25 • 81 • 4

MiniLLM/MiniPLM-Qwen-200M

Text Generation • 0.2B • Updated Oct 27, 2024 • 468 • 9

MiniLLM/MiniPLM-Qwen-500M

Text Generation • 0.5B • Updated Mar 25 • 60 • 7

MiniLLM/Pretrain-Qwen-1.2B

Text Generation • 1B • Updated Mar 25 • 26

MiniLLM/Pretrain-Qwen-500M

Text Generation • 0.5B • Updated Mar 25 • 20

MiniLLM/Pretrain-Qwen-200M

Text Generation • 0.2B • Updated Mar 25 • 50

MiniLLM/MiniPLM-Mamba-130M

Text Generation • 0.1B • Updated Mar 25 • 10 • 3

MiniLLM/MiniPLM-llama3.1-212M

Text Generation • 0.2B • Updated Mar 25 • 73 • 6

MiniLLM/VanillaKD-Pretrain-Qwen-200M

Text Generation • 0.2B • Updated Mar 25 • 17

MiniLLM/VanillaKD-Pretrain-Qwen-500M

Text Generation • 0.5B • Updated Mar 25 • 14

MiniLLM/VanillaKD-Pretrain-Qwen-1.2B

Text Generation • 1B • Updated Mar 25 • 14

RichardErkhov/MiniLLM_-_MiniPLM-Qwen-1.2B-gguf

1B • Updated Oct 27, 2024 • 64

MiniLLM/Ref-Pretrain-Qwen-104M

Text Generation • 0.1B • Updated Mar 25 • 52 • 2

RichardErkhov/MiniLLM_-_Pretrain-Qwen-1.2B-gguf

1B • Updated Nov 1, 2024 • 74

RichardErkhov/MiniLLM_-_MiniPLM-Qwen-200M-gguf

0.2B • Updated Nov 3, 2024 • 316

RichardErkhov/MiniLLM_-_MiniPLM-Qwen-500M-gguf

0.5B • Updated Nov 3, 2024 • 185

RichardErkhov/MiniLLM_-_MiniPLM-Qwen-500M-awq

0.2B • Updated Dec 3, 2024 • 4

RichardErkhov/MiniLLM_-_MiniPLM-llama3.1-212M-awq

0.1B • Updated Dec 6, 2024 • 5

RichardErkhov/MiniLLM_-_Pretrain-Qwen-500M-exl2

RichardErkhov/MiniLLM_-_VanillaKD-Pretrain-Qwen-500M-exl2

RichardErkhov/MiniLLM_-_MiniPLM-Qwen-500M-exl2

RichardErkhov/MiniLLM_-_MiniPLM-llama3.1-212M-gguf

0.2B • Updated Feb 9 • 282

RichardErkhov/MiniLLM_-_Ref-Pretrain-Qwen-104M-gguf

0.1B • Updated Feb 12 • 215 • 2

RichardErkhov/MiniLLM_-_VanillaKD-Pretrain-Qwen-1.2B-gguf

1B • Updated Feb 22 • 145

RichardErkhov/MiniLLM_-_VanillaKD-Pretrain-Qwen-500M-gguf

0.5B • Updated Mar 14 • 162

RichardErkhov/MiniLLM_-_Pretrain-Qwen-500M-gguf

0.5B • Updated Mar 14 • 232

RichardErkhov/MiniLLM_-_MiniPLM-Mamba-130M-4bits

97M • Updated Mar 21 • 7

RichardErkhov/MiniLLM_-_MiniPLM-Mamba-130M-8bits

0.1B • Updated Mar 21 • 6

RichardErkhov/MiniLLM_-_MiniPLM-Qwen-200M-4bits

0.2B • Updated Mar 21 • 6

RichardErkhov/MiniLLM_-_MiniPLM-Qwen-200M-8bits

0.2B • Updated Mar 21 • 5