Outils pour utilisateurs

Outils du site


informatique:egpu

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
informatique:egpu [14/01/2026 08:38] – [nvidia-headless-575-open] cyrilleinformatique:egpu [08/02/2026 10:31] (Version actuelle) – [PNY OC 16GB Geforce RTX 5060 Ti] cyrille
Ligne 14: Ligne 14:
     * acheté     * acheté
     * ✅ RTX 3060 ok     * ✅ RTX 3060 ok
-    * ✗ RTX 5060 à peu près ok ([[informatique:ai_lm:ai_coding:gpu_bench|ça plante selon les modèles]]) +    * ❌ RTX 5060 à peu près ok ([[informatique:ai_lm:gpu_bench|ça plante selon les modèles]]) 
-  [[https://fr.aliexpress.com/item/1005007990218564.html?|WKG-L19C70]] Wikingoo +      Ça plante après plusieurs inférences (llama.cpp, cuda 12.9)
-    * Le vendeur dit qu'elle fonctionnera mieux que la L17 avec la RTX 5060 ...+
   * [[http://www.cyidpcie.cn/page/HL7.html|TB3-HL7]]   * [[http://www.cyidpcie.cn/page/HL7.html|TB3-HL7]]
     * acheté     * acheté
Ligne 22: Ligne 21:
     * ✅ RTX 3060 ok     * ✅ RTX 3060 ok
     * ❌ RTX 5060 failed     * ❌ RTX 5060 failed
-  * [[https://fr.aliexpress.com/item/1005008424134383.html|ADT UT4G-BK7]] TB3/TB4 vers PCIe x16 PCIe 4.0 x4 GPU Dock+  * [[https://fr.aliexpress.com/item/1005007990218564.html?|WKG-L19C70]] Wikingoo 
 +    * Le vendeur dit qu'elle fonctionnera mieux que la L17 avec la RTX 5060 ... 
 +    * Mais des acheteurs signalent des déconnexions https://community.frame.work/t/egpu-disconnects-fw-13-amd/73265 
 +  * ADT UT4G 
 +    * USB4/TB3/T4B to Pcie X16 adapter for eGPU 
 +    * https://www.adtlink.cn/en/product/UT4G.html 
 +      * $128 https://www.adt.link/product/UT4G-Shop.html 
 +    * [[https://fr.aliexpress.com/item/1005008424134383.html|ADT UT4G-BK7]] TB3/TB4 vers PCIe x16 PCIe 4.0 x4 GPU Dock 
 +  * AOOSTAR 
 +    * AG02 Oculink/USB4, avec PSU 
 +      * $219 https://aoostar.com/products/aoostar-ag01-egpu-dock-with-oculink-port-built-in-huntkey-400w-power-supply-supports-tgx-interface-hot-swap 
 +    * AOOSTAR EG02 TB5+Oculink 
 +      * $219 https://aoostar.com/collections/egpu-series/products/aoosatr-eg02-tb5-oculink 
 +      * acheté 
 +      * ✅ RTX 3060 ok 
 +      * ❌ RTX 5060 failed 
 +  * Minisforum DEG2 OCulink Thunderbolt 5 eGPU Dock 
 +    * Thunderbolt 5 Port | Up to 80Gps, OCuLink (PCIe 4.0 ×4) | Up to 64Gps, Built-in M.2 2280 SSD, Compatible with ATX / SFX PSU 
 +    * $259 https://www.minisforum.com/fr/products/deg2 ("ajouter au panier" pour voir le prix) 
 +  * EXP-GDC TH5P4 
 +    * ???
  
 Au final on ne fait tourner que de petits models avec de petit context ... Au final on ne fait tourner que de petits models avec de petit context ...
Ligne 147: Ligne 166:
 parm:           uvm_release_asserts_dump_stack:dump_stack() on failed UVM release asserts. (int) parm:           uvm_release_asserts_dump_stack:dump_stack() on failed UVM release asserts. (int)
 parm:           uvm_release_asserts_set_global_error:Set UVM global fatal error on failed release asserts. (int) parm:           uvm_release_asserts_set_global_error:Set UVM global fatal error on failed release asserts. (int)
 +
 +$ systool -m nvidia_uvm -v
 +
 +Module = "nvidia_uvm"
 +  Attributes:
 +    coresize            = "2154496"
 +    initsize            = "0"
 +    initstate           = "live"
 +    refcnt              = "4"
 +    srcversion          = "B7E9DECF7BD1D315EBCCCF0"
 +    taint               = "OE"
 +    uevent              = <store method only>
 +    version             = "580.126.09"
 +  Parameters:
 +    uvm_ats_mode        = "1"
 +    uvm_block_cpu_to_cpu_copy_with_ce= "0"
 +    uvm_channel_gpfifo_loc= "auto"
 +    uvm_channel_gpput_loc= "auto"
 +    uvm_channel_num_gpfifo_entries= "1024"
 +    uvm_channel_pushbuffer_loc= "auto"
 +    uvm_conf_computing_channel_iv_rotation_limit= "2147483648"
 +    uvm_cpu_chunk_allocation_sizes= "2166784"
 +    uvm_debug_enable_push_acquire_info= "0"
 +    uvm_debug_enable_push_desc= "0"
 +    uvm_debug_prints    = "0"
 +    uvm_disable_hmm     = "Y"
 +    uvm_downgrade_force_membar_sys= "1"
 +    uvm_enable_builtin_tests= "0"
 +    uvm_enable_debug_procfs= "0"
 +    uvm_enable_va_space_mm= "1"
 +    uvm_exp_gpu_cache_peermem= "0"
 +    uvm_exp_gpu_cache_sysmem= "0"
 +    uvm_fault_force_sysmem= "0"
 +    uvm_force_prefetch_fault_support= "0"
 +    uvm_global_oversubscription= "1"
 +    uvm_leak_checker    = "0"
 +    uvm_page_table_location= "(null)"
 +    uvm_peer_copy       = "phys"
 +    uvm_perf_access_counter_batch_count= "256"
 +    uvm_perf_access_counter_migration_enable= "-1"
 +    uvm_perf_access_counter_threshold= "256"
 +    uvm_perf_fault_batch_count= "256"
 +    uvm_perf_fault_coalesce= "1"
 +    uvm_perf_fault_max_batches_per_service= "20"
 +    uvm_perf_fault_max_throttle_per_service= "5"
 +    uvm_perf_fault_replay_policy= "2"
 +    uvm_perf_fault_replay_update_put_ratio= "50"
 +    uvm_perf_map_remote_on_eviction= "1"
 +    uvm_perf_map_remote_on_native_atomics_fault= "0"
 +    uvm_perf_migrate_cpu_preunmap_block_order= "2"
 +    uvm_perf_migrate_cpu_preunmap_enable= "1"
 +    uvm_perf_pma_batch_nonpinned_order= "6"
 +    uvm_perf_prefetch_enable= "1"
 +    uvm_perf_prefetch_min_faults= "1"
 +    uvm_perf_prefetch_threshold= "51"
 +    uvm_perf_reenable_prefetch_faults_lapse_msec= "1000"
 +    uvm_perf_thrashing_enable= "1"
 +    uvm_perf_thrashing_epoch= "2000"
 +    uvm_perf_thrashing_lapse_usec= "500"
 +    uvm_perf_thrashing_max_resets= "4"
 +    uvm_perf_thrashing_nap= "1"
 +    uvm_perf_thrashing_pin= "300"
 +    uvm_perf_thrashing_pin_threshold= "10"
 +    uvm_perf_thrashing_threshold= "3"
 +    uvm_release_asserts = "1"
 +    uvm_release_asserts_dump_stack= "0"
 +    uvm_release_asserts_set_global_error= "0"
 </code> </code>
 +
 +Le plantage de la RTX 5060 Ti arrive plus tard si ''options nvidia_uvm uvm_disable_hmm=1''.
  
 ==== Séries RTX ==== ==== Séries RTX ====
Ligne 186: Ligne 274:
  
 J'ai acheté un câble Thunderbolt certifié (50€) pour remplacer celui fourni avec l'eGPU. **On dirait que ça fonctionne mieux, mais ça plante facilement** ''kernel: NVRM: nvAssertOkFailedNoLog: Assertion failed: GPU lost from the bus [NV_ERR_GPU_IS_LOST] (0x0000000F) returned from pRmApi->Control() ... NVRM: nvGpuOpsReportFatalError: uvm encountered global fatal error 0x60, requiring os reboot to recover ...'' J'ai acheté un câble Thunderbolt certifié (50€) pour remplacer celui fourni avec l'eGPU. **On dirait que ça fonctionne mieux, mais ça plante facilement** ''kernel: NVRM: nvAssertOkFailedNoLog: Assertion failed: GPU lost from the bus [NV_ERR_GPU_IS_LOST] (0x0000000F) returned from pRmApi->Control() ... NVRM: nvGpuOpsReportFatalError: uvm encountered global fatal error 0x60, requiring os reboot to recover ...''
 +
 +Toujours plantage avec driver nvidia 590, cuda 13.1 et conf modprobe.
 +
 === nvidia-kkms-565 === === nvidia-kkms-565 ===
  
Ligne 276: Ligne 367:
 === Avec le bridge Wikingoo WKGL17-C50 === === Avec le bridge Wikingoo WKGL17-C50 ===
  
-Avec certains modèles ya "[[informatique:ai_lm:ai_coding:gpu_bench|CUDA Error]]" et dans les logs ya :+Avec certains modèles ya "[[informatique:ai_lm:gpu_bench|CUDA Error]]" et dans les logs ya :
  
 <code> <code>
informatique/egpu.1768376287.txt.gz · Dernière modification : de cyrille

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC0 1.0 Universal
CC0 1.0 Universal Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki