2024年1月31日 星期三

nvidia driver 靜默安裝

 電腦之前安裝過driver(非透過apt安裝,因為apt提供的driver有時會太過老舊,deep learning使用的framework無法使用),每次ubuntu的kernel更新後又需要重新安裝時:


sudo ./NVIDIA-Linux-x86_64-545.29.02.run -s --sanity

沒有留言:

張貼留言

DGX 分散儲存系統筆記

以torch的DDP(distributed data parallel)作為基底考慮: 1. 進行torchrun的時候僅需指定master node IP 2. 掛載資料區時建議以rank0的機器做下載,其他機器都Share同一個資料夾,所以需要透過iSCSI或是NFS進行 ...