Différences

Ci-dessous, les différences entre deux révisions de la page.

--- informatique:ai_lm [07/02/2026 16:06] – [LiteLLM] cyrille
+++ informatique:ai_lm [01/03/2026 14:05] (Version actuelle) – [Compilation pour GPU] cyrille
@@ Ligne 14: / Ligne 14: @@
   * [[/informatique/ai_lm/ai_image|AI Image]]
   * [[/informatique/ai_lm/gpu_bench|GPU Benchmarks]]
+  * [[/informatique/ai_lm/ai_vision|AI Vision]]
 ===== Glossaire =====
@@ Ligne 318: / Ligne 319: @@
 user	104m56,615s
 sys	3m45,431s
+# Plus récemment
+real	6m35,663s
+user	61m37,436s
+sys	2m37,613s
 </code>
+Avec CUDA 13.1 llama.cpp plante direct à la 1ère requête, mais sans message dans syslog : ce n'est donc pas le driver mais le logiciel llama.cpp qui ne support pas cette version de CUDA :
+<code>
+/home/cyrille/Code/bronx/AI_Coding/llama.cpp/ggml/src/ggml-cuda/ggml-cuda.cu:97: CUDA error
+CUDA error: invalid argument
+  current device: 0, in function ggml_cuda_mul_mat_q at /home/cyrille/Code/bronx/AI_Coding/llama.cpp/ggml/src/ggml-cuda/mmq.cu:179
+</code>
 ==== ollama ====
@@ Ligne 358: / Ligne 371: @@
-==== Tabby ML ====
-Est à la fois le serveur de model et l'[[#tabby|assistant de code]].
-https://tabby.tabbyml.com/docs/quick-start/installation/linux/
-Fourni llama.cpp.