Outils pour utilisateurs

Outils du site


informatique:egpu

Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
informatique:egpu [24/04/2026 10:55] – [nvidia-uvm] cyrilleinformatique:egpu [24/04/2026 11:52] (Version actuelle) – [Update 2026-04] cyrille
Ligne 57: Ligne 57:
 sudo apt upgrade sudo apt upgrade
 > ... Building initial module nvidia/595.58.03 for 6.17.0-22-generic ... > ... Building initial module nvidia/595.58.03 for 6.17.0-22-generic ...
 +# Oups, penser à supprimer version 590
 +sudo apt purge nvidia-utils-590 nvidia-driver-590-open nvidia-dkms-590-open nvidia-compute-utils-590
 </code> </code>
 +
 +Après l'installation vérifier dans ''/etc/modprobe.d/nvidia-graphics-drivers-kms.conf'' que ''options nvidia_drm modeset=0'' car par défaut il est à ''1'' et donc Xorg aura un process dans la RTX, visible avec ''nvidia-smi''.
 +
 +
 +Branchement de la RTX via THB
 +<code>
 +kernel: thunderbolt 0-1: new device found, vendor=0x215 device=0x41
 +kernel: thunderbolt 0-1: TB4 HOME TB4 eGFX
 +boltd[1096]: [c9030000-0080-TB4 eGFX                   ] parent is 7dbb8780-4047...
 +...
 +kernel: nvidia: loading out-of-tree module taints kernel.
 +kernel: nvidia: module verification failed: signature and/or required key missing - tainting kernel
 +kernel: nvidia-nvlink: Nvlink Core is being initialized, major device number 508
 +kernel: 
 +kernel: nvidia 0000:05:00.0: enabling device (0000 -> 0003)
 +kernel: nvidia 0000:05:00.0: vgaarb: VGA decodes changed: olddecodes=io+mem,decodes=none:owns=none
 +kernel: NVRM: loading NVIDIA UNIX Open Kernel Module for x86_64  595.58.03  Release Build  (dvs-builder@U22-I3-AM25-28-3)  Tue Mar 17 19:55:10 UTC 2026
 +systemd[2149]: Reached target sound.target - Sound Card.
 +kernel: nvidia-modeset: Loading NVIDIA UNIX Open Kernel Mode Setting Driver for x86_64  595.58.03  Release Build  (dvs-builder@U22-I3-AM25-28-3)  Tue Mar 17 19:39:14 UTC 2026
 +kernel: [drm] [nvidia-drm] [GPU ID 0x00000500] Loading driver
 +kernel: [drm] Initialized nvidia-drm 0.0.0 for 0000:05:00.0 on minor 0
 +kernel: nvidia 0000:05:00.0: [drm] Cannot find any crtc or sizes
 +systemd[1]: Starting nvidia-persistenced.service - NVIDIA Persistence Daemon...
 +nvidia-persistenced[4123]: Verbose syslog connection opened
 +nvidia-persistenced[4123]: Now running with user ID 124 and group ID 127
 +nvidia-persistenced[4123]: Started (4123)
 +nvidia-persistenced[4123]: device 0000:05:00.0 - registered
 +nvidia-persistenced[4123]: Local RPC services initialized
 +systemd[1]: Started nvidia-persistenced.service - NVIDIA Persistence Daemon.
 +boltd[1120]: probing: timeout, done: [2644839] (2000000)
 +...
 +</code>
 +
 +Essai avec llama.cpp tout frais et compilé avec CUDA_ARCHITECTURES=120 et CUDA 12.9.
 +  * 🚀 Quelques questions dans le chat de llama.cpp : Ok
 +  * 🚀 Refactoring de code avec ''opencode'' et le modèle ''gpt-oss-20b-UD-Q4_K_XL.gguf'' : Ok
 +  * 😩 Détection sur un boucle d'images avec Yolo26 : Fail, plantage après un certains nombre d'itérations
 +    * **Xid 79 "GPU has fallen off the bus"**
 +
 +<code>
 +kernel: NVRM: GPU at PCI:0000:05:00: GPU-ab296f23-e6a6-a23b-b6c1-33f9b813df84
 +kernel: NVRM: GPU Board Serial Number: 0
 +kernel: NVRM: Xid (PCI:0000:05:00): 79, pid=8699, name=python3, GPU has fallen off the bus.
 +kernel: NVRM: GPU 0000:05:00.0: GPU has fallen off the bus.
 +kernel: NVRM: GPU 0000:05:00.0: GPU serial number is 0.
 +kernel: NVRM: GPU0 krcRcAndNotifyAllChannels_IMPL: RC all channels for critical error 79.
 +kernel: NVRM: GPU0 _threadNodeCheckTimeout: API_GPU_ATTACHED_SANITY_CHECK failed!
 +...
 +kernel: NVRM: GPU0 _issueRpcAndWait: rpcSendMessage failed with status 0x0000000f for fn 78 sequence 2397!
 +kernel: NVRM: GPU0 nvCheckOkFailedNoLog: Check failed: GPU lost from the bus [NV_ERR_GPU_IS_LOST] (0x0000000F) returned from nvdEngineDumpCallbackHelper(pGpu, pPrbEnc, pNvDumpState, pEngineCallback) @ nv_debug_dump.c:273
 +...
 +</code>
 +
 +Alors je passe au nouvel essai proposé sur [[https://github.com/NVIDIA/open-gpu-kernel-modules/issues/974#issuecomment-4311518502|RTX 5060 Ti eGPU unable to init, falls of the bus immediately]].
  
 ===== Nvidia ===== ===== Nvidia =====
informatique/egpu.1777020938.txt.gz · Dernière modification : de cyrille

Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC0 1.0 Universal
CC0 1.0 Universal Donate Powered by PHP Valid HTML5 Valid CSS Driven by DokuWiki