Différences

Ci-dessous, les différences entre deux révisions de la page.

--- informatique:ai_lm:gpu_bench [25/06/2026 18:18] – [Qwen3-Coder-30B-A3B-Instruct-Q4_K_M] cyrille
+++ informatique:ai_lm:gpu_bench [25/06/2026 18:18] (Version actuelle) – [Nemotron-Cascade-2-30B-A3B] cyrille
@@ Ligne 384: / Ligne 384: @@
 J'ai essayé des ''-ngl'' petit mais ça passe pas.
+<code>
 $ ./llama.cpp/build/bin/llama-bench -m /data/models/Nemotron-Cascade-2-30B-A3B-Q4_K_M.gguf -p 0 -n 128,256,512
 ggml_cuda_init: found 1 CUDA devices (Total VRAM: 15849 MiB):
@@ Ligne 390: / Ligne 391: @@
 | ------------------------------ | ---------: | ---------: | ---------- | --: | --------------: | -------------------: |
 llama_bench: error: failed to load model '/data/models/Nemotron-Cascade-2-30B-A3B-Q4_K_M.gguf'
+</code>
 ==== INstabilité avec eGPU 😩 ====