Outils pour utilisateurs

Outils du site


informatique:ai_lm:gpu_bench

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
informatique:ai_lm:gpu_bench [25/06/2026 18:18] – [Qwen3-Coder-30B-A3B-Instruct-Q4_K_M] cyrilleinformatique:ai_lm:gpu_bench [25/06/2026 18:18] (Version actuelle) – [Nemotron-Cascade-2-30B-A3B] cyrille
Ligne 384: Ligne 384:
 J'ai essayé des ''-ngl'' petit mais ça passe pas. J'ai essayé des ''-ngl'' petit mais ça passe pas.
  
 +<code>
 $ ./llama.cpp/build/bin/llama-bench -m /data/models/Nemotron-Cascade-2-30B-A3B-Q4_K_M.gguf -p 0 -n 128,256,512 $ ./llama.cpp/build/bin/llama-bench -m /data/models/Nemotron-Cascade-2-30B-A3B-Q4_K_M.gguf -p 0 -n 128,256,512
 ggml_cuda_init: found 1 CUDA devices (Total VRAM: 15849 MiB): ggml_cuda_init: found 1 CUDA devices (Total VRAM: 15849 MiB):
Ligne 390: Ligne 391:
 | ------------------------------ | ---------: | ---------: | ---------- | --: | --------------: | -------------------: | | ------------------------------ | ---------: | ---------: | ---------- | --: | --------------: | -------------------: |
 llama_bench: error: failed to load model '/data/models/Nemotron-Cascade-2-30B-A3B-Q4_K_M.gguf' llama_bench: error: failed to load model '/data/models/Nemotron-Cascade-2-30B-A3B-Q4_K_M.gguf'
 +</code>
  
 ==== INstabilité avec eGPU 😩 ==== ==== INstabilité avec eGPU 😩 ====
informatique/ai_lm/gpu_bench.1782404305.txt.gz · Dernière modification : de cyrille

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC0 1.0 Universal
CC0 1.0 Universal Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki