giladgd
/

Apertus-70B-Instruct-2509-GGUF

Text Generation

Model card Files Files and versions

giladgd commited on Oct 3

Commit

43a53c7

·

verified ·

1 Parent(s): b0fec72

Update README.md

Files changed (1) hide show

README.md +4 -5

README.md CHANGED Viewed

@@ -54,7 +54,6 @@ Static quants of [`swiss-ai/Apertus-70B-Instruct-2509`](https://huggingface.co/s
 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.Q5_K_M.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q5_K_M` | Q5_K_M | 50.6GB |
 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.Q6_K.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q6_K` | Q6_K | 57.9GB |
 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.Q8_0.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q8_0` | Q8_0 | 75.0GB |
-| [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.MXFP4.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:MXFP4` | MXFP4 | 75.0GB |
 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.F16.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:F16` | F16 | 141.2GB |
 > [!TIP]
@@ -74,7 +73,7 @@ brew install nodejs
 ### CLI
 Chat with the model:
 ```bash
-npx -y node-llama-cpp chat hf:giladgd/Apertus-70B-Instruct-2509-GGUF:MXFP4
 ```
 ### Code
@@ -86,7 +85,7 @@ npm install node-llama-cpp
 ```typescript
 import {getLlama, resolveModelFile, LlamaChatSession} from "node-llama-cpp";
-const modelUri = "hf:giladgd/Apertus-70B-Instruct-2509-GGUF:MXFP4";
 const llama = await getLlama();
@@ -119,10 +118,10 @@ brew install llama.cpp
 ### CLI
 ```bash
-llama-cli -hf giladgd/Apertus-70B-Instruct-2509-GGUF:MXFP4 -p "The meaning to life and the universe is"
 ```
 ### Server
 ```bash
-llama-server -hf giladgd/Apertus-70B-Instruct-2509-GGUF:MXFP4 -c 2048
 ```

 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.Q5_K_M.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q5_K_M` | Q5_K_M | 50.6GB |
 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.Q6_K.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q6_K` | Q6_K | 57.9GB |
 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.Q8_0.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q8_0` | Q8_0 | 75.0GB |
 | [GGUF](https://huggingface.co/giladgd/Apertus-70B-Instruct-2509-GGUF/resolve/main/Apertus-70B-Instruct-2509.F16.gguf) | `hf:giladgd/Apertus-70B-Instruct-2509-GGUF:F16` | F16 | 141.2GB |
 > [!TIP]
 ### CLI
 Chat with the model:
 ```bash
+npx -y node-llama-cpp chat hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q4_K_M
 ```
 ### Code
 ```typescript
 import {getLlama, resolveModelFile, LlamaChatSession} from "node-llama-cpp";
+const modelUri = "hf:giladgd/Apertus-70B-Instruct-2509-GGUF:Q4_K_M";
 const llama = await getLlama();
 ### CLI
 ```bash
+llama-cli -hf giladgd/Apertus-70B-Instruct-2509-GGUF:Q4_K_M -p "The meaning to life and the universe is"
 ```
 ### Server
 ```bash
+llama-server -hf giladgd/Apertus-70B-Instruct-2509-GGUF:Q4_K_M -c 2048
 ```