Outils pour utilisateurs

Outils du site


informatique:ai_lm:gpu_bench

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
informatique:ai_lm:gpu_bench [20/04/2026 16:50] – [GPU Bench] cyrilleinformatique:ai_lm:gpu_bench [30/04/2026 17:45] (Version actuelle) – [GPU Bench] cyrille
Ligne 3: Ligne 3:
   * [[https://blogs.nvidia.com/blog/tag/rtx-ai-garage/|RTX AI Garage]] sur blog de nvidia   * [[https://blogs.nvidia.com/blog/tag/rtx-ai-garage/|RTX AI Garage]] sur blog de nvidia
  
 +  * Gigabyte Windforce OC 12GB Geforce RTX 3060, **354 €TTC** neuve 2025-11
 +  * PNY OC 16 Go Geforce RTX 5060 Ti, **450 €TTC** neuve 2025-11
  
 Benchmark d'IA pour [[https://lab.cyrille.giquello.fr/Anticor/graphLmExtract.html|extraction de noms]] : Benchmark d'IA pour [[https://lab.cyrille.giquello.fr/Anticor/graphLmExtract.html|extraction de noms]] :
Ligne 19: Ligne 21:
   * Prompt processing: b128, b256, b512 : ''-p 1024 -n 0 -b 128,256,512''   * Prompt processing: b128, b256, b512 : ''-p 1024 -n 0 -b 128,256,512''
  
-^  models                          ^ test  ^  tokens/seconds  ^^^ +^  models                           ^ test   ^  tokens/seconds                             ^^^              
-                                       ^ i7-1360P ^ RTX 3060 ^ RTX 5060 Ti ^ +                                         ^ i7-1360P         ^ i7-1360P SYCL  ^ RTX 3060  ^ RTX 5060 Ti  
-| Qwen2.5-coder-7b-instruct-q5_k_m | tg128 |    5.47 |     57.65 |       73.54 | +| Qwen2.5-coder-7b-instruct-q5_k_m  | tg128              5.47 |                |     57.65 |        73.54 | 
-| //size: 5.07 GiB//               | tg256 |     ... |     57.61 |       73.32 | +| //size: 5.07 GiB//                | tg256               ... |                |     57.61 |        73.32 | 
-                                 | tg512 |     ... |     56.20 |       71.80 | +                                  | tg512               ... |                |     56.20 |        71.80 | 
-                                 | b128      ... |   1825.17 |     2840.57 | +                                  | b128                ... |                |   1825.17 |      2840.57 | 
-                                 | b256      ... |   1924.10 |     3209.52 | +                                  | b256                ... |                |   1924.10 |      3209.52 | 
-                                 | b512      ... |   1959.18 |     3271.22 | +                                  | b512                ... |                |   1959.18 |      3271.22 | 
-| Qwen2.5-coder-7b-instruct-q8_0   | tg128 |     ... |     41.42 |       50.33 | +| Qwen2.5-coder-7b-instruct-q8_0    | tg128               ... |                |     41.42 |        50.33 | 
-| //size: 7.54 GiB//               | tg256 |     ... |     41.38 |       50.33 | +| //size: 7.54 GiB//                | tg256               ... |                |     41.38 |        50.33 | 
-                                 | tg512 |     ... |     40.70 |       49.62 | +                                  | tg512               ... |                |     40.70 |        49.62 | 
-                                 | b128    13.98 |   1952.96 |     2972.52 | +                                  | b128   |            13.98 |          36.34 |   1952.96 |      2972.52 | 
-                                 | b256      ... |   2054.09 |     3460.41 | +                                  | b256                ... |          42.28 |   2054.09 |      3460.41 | 
-                                 | b512      ... |   2093.21 |     3511.29 | +                                  | b512                ... |          45.99 |   2093.21 |      3511.29 | 
-| EuroLLM-9B-Instruct-Q4_0         | tg128 |     ... |     56.06 |       71.41 | +| EuroLLM-9B-Instruct-Q4_0          | tg128               ... |                |     56.06 |        71.41 | 
-| //size: 4.94 GiB//               | tg256 |     ... |     55.96 |       71.15 | +| //size: 4.94 GiB//                | tg256               ... |                |     55.96 |        71.15 | 
-                                 | tg512 |     ... |     53.87 |       69.45 | +                                  | tg512               ... |                |     53.87 |        69.45 | 
-                                 | b128      ... |   1433.95 |  CUDA error | +                                  | b128                ... |                |   1433.95 |   CUDA error | 
-                                 | b256      ... |   1535.06 |         ... | +                                  | b256                ... |                |   1535.06 |          ... | 
-                                 | b512      ... |   1559.88 |         ... | +                                  | b512                ... |                |   1559.88 |          ... | 
-| Qwen3-14B-UD-Q5_K_XL             | tg128 |     ... |     30.00 |       37.66 | +| Qwen3-14B-UD-Q5_K_XL              | tg128               ... |                |     30.00 |        37.66 | 
-| //size: 9.82 GiB//               | tg256 |     ... |     29.97 |       38.17 | +| //size: 9.82 GiB//                | tg256               ... |                |     29.97 |        38.17 | 
-                                 | tg512 |     ... |     29.25 |       37.30 | +                                  | tg512               ... |                |     29.25 |        37.30 | 
-                                 | b128      ... |    903.97 |  CUDA error | +                                  | b128                ... |                |    903.97 |   CUDA error | 
-                                 | b256      ... |    951.71 |         ... | +                                  | b256                ... |                |    951.71 |          ... | 
-                                 | b512      ... |    963.76 |         ... | +                                  | b512                ... |                |    963.76 |          ... | 
-| Qwen3-4B-UD-Q8_K_XL              | tg128 |    7.37 |     56.35 |         ... | +| Qwen3-4B-UD-Q8_K_XL               | tg128              7.37 |                |     56.35 |          ... | 
-| //size: 4.70 GiB//               | tg256 |    6.63 |     56.35 |         ... | +| //size: 4.70 GiB//                | tg256              6.63 |                |     56.35 |          ... | 
-                                 | tg512 |    6.24 |     54.56 |         ... | +                                  | tg512              6.24 |                |     54.56 |          ... | 
-                                 | b128    20.66 |   2163.17 |         ... | +                                  | b128   |            20.66 |                |   2163.17 |          ... | 
-                                 | b256      ... |   2405.27 |         ... | +                                  | b256                ... |                |   2405.27 |          ... | 
-                                 | b512      ... |   2495.35 |         ... | +                                  | b512                ... |                |   2495.35 |          ... | 
-| GemmaCoder3-12B-IQ4_NL.gguf      | tg128 |     ... |     40.70 |         ... | +| GemmaCoder3-12B-IQ4_NL.gguf       | tg128               ... |                |     40.70 |          ... | 
-| //size: 6.41 GiB//               | tg256 |     ... |     40.67 |         ... | +| //size: 6.41 GiB//                | tg256               ... |                |     40.67 |          ... | 
-                                 | tg512 |     ... |     39.54 |         ... | +                                  | tg512               ... |                |     39.54 |          ... | 
-                                 | b128      ... |   1150.11 |         ... | +                                  | b128                ... |                |   1150.11 |          ... | 
-                                 | b256      ... |   1218.27 |         ... | +                                  | b256                ... |                |   1218.27 |          ... | 
-                                 | b512      ... |   1253.92 |         ... | +                                  | b512                ... |                |   1253.92 |          ... | 
-| Gemma3-Code-Reasoning-4B.Q8_0    | tg128 |     ... |     66.98 |         ... | +| Gemma3-Code-Reasoning-4B.Q8_0     | tg128               ... |                |     66.98 |          ... | 
-| //size: 3.84 GiB//               | tg256 |     ... |     66.95 |         ... | +| //size: 3.84 GiB//                | tg256               ... |                |     66.95 |          ... | 
-                                 | tg512 |     ... |     65.75 |         ... | +                                  | tg512               ... |                |     65.75 |          ... | 
-                                 | b128      ... |   2885.80 |         ... | +                                  | b128                ... |                |   2885.80 |          ... | 
-                                 | b256      ... |   3266.87 |         ... | +                                  | b256                ... |                |   3266.87 |          ... | 
-                                 | b512      ... |   3457.03 |         ... | +                                  | b512                ... |                |   3457.03 |          ... | 
-| GemmaCoder3-12B-Q5_K_M           | tg128 |     ... |     34.10 |         ... | +| GemmaCoder3-12B-Q5_K_M            | tg128               ... |                |     34.10 |          ... | 
-| //size: 7.86 GiB//               | tg256 |     ... |     34.06 |         ... | +| //size: 7.86 GiB//                | tg256               ... |                |     34.06 |          ... | 
-                                 | tg512 |     ... |     33.28 |         ... | +                                  | tg512               ... |                |     33.28 |          ... | 
-                                 | b128      ... |   1045.27 |         ... | +                                  | b128                ... |                |   1045.27 |          ... | 
-                                 | b256      ... |   1108.95 |         ... | +                                  | b256                ... |                |   1108.95 |          ... | 
-                                 | b512      ... |   1144.97 |         ... | +                                  | b512                ... |                |   1144.97 |          ... | 
-| gpt-oss 20B MXFP4 MoE            | tg128 |     ... |     92.86 |         ... | +| gpt-oss 20B MXFP4 MoE             | tg128               ... |                |     92.86 |          ... | 
-| gpt-oss-20b-mxfp4.gguf           | tg256 |     ... |     92.69 |         ... | +| gpt-oss-20b-mxfp4.gguf            | tg256               ... |                |     92.69 |          ... | 
-| //size: 11.27 GiB//              | tg512 |     ... |     88.17 |         ... | +| //size: 11.27 GiB//               | tg512               ... |                |     88.17 |          ... | 
-                                 | b128      ... |   1036.08 |         ... | +                                  | b128                ... |                |   1036.08 |          ... | 
-                                 | b256      ... |   1452.01 |         ... | +                                  | b256                ... |                |   1452.01 |          ... | 
-                                 | b512      ... |   1744.71 |         ... | +                                  | b512                ... |                |   1744.71 |          ... | 
-| gpt-oss 20B Q4_K - Medium        | tg128 |     ... |     97.47         ... | +| gpt-oss 20B Q4_K - Medium         | tg128               ... |                |     98.05          ... | 
-| gpt-oss-20b-UD-Q4_K_XL.gguf      | tg256 |     ... |     97.20 |         ... | +| gpt-oss-20b-UD-Q4_K_XL.gguf       | tg256               ... |                |     97.20 |          ... | 
-| //size: 11.04 GiB//              | tg512 |     ... |     92.43 |         ... | +| //size: 11.04 GiB//               | tg512               ... |                |     92.43 |          ... | 
-                                 | b128      ... |   1034.15 |         ... | +                                  | b128                ... |                |   1034.15 |          ... | 
-                                 | b256      ... |   1450.77 |         ... | +                                  | b256                ... |                |   1450.77 |          ... | 
-                                 | b512      ... |   1734.35 |         ... |+                                  | b512                ... |                |   1734.35 |          ... |
  
  
Ligne 298: Ligne 300:
 </code> </code>
  
-**Mais non**, ça a bien fonctionné avec ''llama-bench'' mais pas avec Yolo:+**Mais non**, ça a bien fonctionné avec ''llama-bench'' mais pas avec Yolo: 😩
  
 <code> <code>
informatique/ai_lm/gpu_bench.1776696605.txt.gz · Dernière modification : de cyrille

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC0 1.0 Universal
CC0 1.0 Universal Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki