Différences

Ci-dessous, les différences entre deux révisions de la page.

--- informatique:ai_lm [08/02/2026 10:48] – [Compilation pour GPU] cyrille
+++ informatique:ai_lm [01/03/2026 14:05] (Version actuelle) – [Compilation pour GPU] cyrille
@@ Ligne 14: / Ligne 14: @@
   * [[/informatique/ai_lm/ai_image|AI Image]]
   * [[/informatique/ai_lm/gpu_bench|GPU Benchmarks]]
+  * [[/informatique/ai_lm/ai_vision|AI Vision]]
 ===== Glossaire =====
@@ Ligne 318: / Ligne 319: @@
 user	104m56,615s
 sys	3m45,431s
+# Plus récemment
+real	6m35,663s
+user	61m37,436s
+sys	2m37,613s
 </code>
-Avec CUDA 13.1 llama.cpp plante direct à la 1ère requête, mais sans message dans syslog : ce n'est pas le driver seulement le logiciel:
+Avec CUDA 13.1 llama.cpp plante direct à la 1ère requête, mais sans message dans syslog : ce n'est donc pas le driver mais le logiciel llama.cpp qui ne support pas cette version de CUDA :
 <code>
 /home/cyrille/Code/bronx/AI_Coding/llama.cpp/ggml/src/ggml-cuda/ggml-cuda.cu:97: CUDA error
@@ Ligne 327: / Ligne 332: @@
 </code>
-Essai flags compilation llama.cpp pour stabilité avec la RTX 5060 Ti :
-<code>
-export CUDA_VERSION=12.5 \
-  && cmake -B build \
-  -DGGML_CUDA=ON \
-  -DGGML_CUDA_GRAPHS=OFF \
-  -DGGML_CUDA_FORCE_MMQ=ON \
-  -DGGML_CUDA_PEER_MAX_BATCH_SIZE=0 \
-  -DGGML_CUDA_F16=OFF \
-  -DCMAKE_CUDA_ARCHITECTURES="86;120" \
-  -DCMAKE_CUDA_COMPILER=/usr/local/cuda-${CUDA_VERSION}/bin/nvcc \
-  -DCMAKE_BUILD_WITH_INSTALL_RPATH=ON \
-  -DCMAKE_INSTALL_RPATH="/usr/local/cuda-${CUDA_VERSION}/lib64;\$ORIGIN"
-</code>
 ==== ollama ====