nvidiaドライバを入れてみる

いつもはCUDAに入っているnvidiaドライバを使っているのですが、場合によってはリリースされているnvidiaドライバを
入れてからcudaのライブラリだけを入れるっていうのがあるみたい。

ほとんど計算機はリモートアクセスでローカルに使う機会がないのでこの辺は暗いです

ESXiでますは手順確認

最小構成で構築したCentOS7.9がある. これにnvidiaドライバを入れてみた
まずはディスクトップ環境を入れる

[root@centos7 ~]# uname -r
3.10.0-1160.el7.x86_64
 
[root@centos7 ~]# lspci -v |grep NVIDIA
13:00.0 VGA compatible controller: NVIDIA Corporation Device 2531 (rev a1) (prog-if 00 [VGA controller])
        Subsystem: NVIDIA Corporation Device 151d
 
[root@centos7 ~]# yum groupinstall "GNOME Desktop"
[root@centos7 ~]# systemctl get-default
multi-user.target
 
[root@centos7 ~]# yum remove gnome-initial-setup
[root@centos7 ~]# reboot

reboot後にユーザでログインして「startx」でGPU画面にはなる. *「multi-user.target」からログインして「startx」です. まだ「graphical.target」ではありません
2022y10m08d_165850157.png

っで次にnvidiaドライバを入れてみる

[root@centos7 ~]# yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
[root@centos7 ~]# yum groupinstall "Development Tools"
[root@centos7 ~]# yum install epel-release
[root@centos7 ~]# yum install dkms
 
[root@centos7 ~]# vi /etc/default/grub
 :
GRUB_CMDLINE_LINUX="crashkernel=auto rhgb quiet"
 ↓
GRUB_CMDLINE_LINUX="crashkernel=auto rhgb quiet nouveau.modeset=0 modprobe.blacklist=nouveau"
 :
[root@centos7 ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
[root@centos7 ~]# grub2-mkconfig -o /boot/efi/EFI/centos/grub.cfg
 
[root@centos7 ~]# bash NVIDIA-Linux-x86_64-515.76.run --disable-nouveau --no-opengl-files --no-libglx-indirect --dkms
    For some distributions, Nouveau can be disabled by adding a file in the modprobe configuration directory.
    --> Yes -> OK
 
    Would you like to register the kernel module sources with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later.
    --> Yes
 
    Install NVIDIA's 32-bit compatibility libraries?
    --> No
 
    Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X driver will be used when you restart X?
    --> No -> OK
    (ここをYesで選択したら「rm /etc/X11/xorg.conf」で削除. これがあるとXが正しく動かない)
 
[root@centos7 ~]# systemctl set-default graphical.target
[root@centos7 ~]# reboot

これで上手く行くみたい

確認としては

[root@centos7 ~]# lshw -class display
  *-display
       description: VGA compatible controller
       product: SVGA II Adapter
       vendor: VMware
       physical id: f
       bus info: pci@0000:00:0f.0
       version: 00
       width: 32 bits
       clock: 33MHz
       capabilities: vga_controller bus_master cap_list rom
       configuration: driver=vmwgfx latency=64
       resources: irq:16 ioport:2040(size=16) memory:e8000000-efffffff memory:f9000000-f97fffff memory:ff300000-ff307fff
  *-display
       description: VGA compatible controller
       product: NVIDIA Corporation
       vendor: NVIDIA Corporation
       physical id: 0
       bus info: pci@0000:13:00.0
       version: a1
       width: 64 bits
       clock: 33MHz
       capabilities: pm msi pciexpress vga_controller bus_master cap_list
       configuration: driver=nvidia latency=248
       resources: irq:65 memory:fb000000-fbffffff memory:c0000000-cfffffff memory:d0000000-d1ffffff ioport:3000(size=128)
[root@centos7 ~]#

とか

削除

インストールしたからには削除も明記する必要があるかなと。

[root@centos7 ~]# nvidia-uninstall
  If you plan to no longer use the NVIDIA driver, you should make sure that no X screens are configured to use the NVIDIA X driver in your X configuration file.
  --> No -> OK
 
[root@centos7 ~]# reboot

ドライバのバージョンとCUDA

これが正しいかは不明ですが、各種nvidiaドライバを入れて、nvidia-smiを叩いて「CUDA Version:」の値を調べた

Driver VersionCUDA Versionメモ
520.56.0611.8
515.7611.7
515.65.0111.7
510.85.0211.6
510.47.0311.6
470.141.0311.4Keplerの上限

nvidiaドライバーをインストールしてからcudaライブラリをインストール

https://developer.nvidia.com/cuda-downloadsから必要なcudaライブラリを入手します
こちらでは「 rpm (local) 」なファイル、

cuda-repo-rhel7-10-1-local-10.1.243-418.87.00-1.0-1.x86_64.rpm
cuda-repo-rhel7-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
cuda-repo-rhel7-11-0-local-11.0.3_450.51.06-1.x86_64.rpm
cuda-repo-rhel7-11-2-local-11.2.0_460.27.04-1.x86_64.rpm
cuda-repo-rhel7-11-2-local-11.2.2_460.32.03-1.x86_64.rpm
cuda-repo-rhel7-11-3-local-11.3.1_465.19.01-1.x86_64.rpm
cuda-repo-rhel7-11-4-local-11.4.3_470.82.01-1.x86_64.rpm
cuda-repo-rhel7-11-5-local-11.5.0_495.29.05-1.x86_64.rpm
cuda-repo-rhel7-11-6-local-11.6.2_510.47.03-1.x86_64.rpm
cuda-repo-rhel7-11-7-local-11.7.0_515.43.04-1.x86_64.rpm
cuda-repo-rhel8-10-2-local-10.2.89-440.33.01-1.0-1.x86_64.rpm
cuda-repo-rhel8-11-3-local-11.3.1_465.19.01-1.x86_64.rpm
cuda-repo-rhel8-11-5-local-11.5.1_495.29.05-1.x86_64.rpm
cuda-repo-rhel8-11-6-local-11.6.0_510.39.01-1.x86_64.rpm
cuda-repo-rhel8-11-7-local-11.7.0_515.43.04-1.x86_64.rpm
cuda-repo-rhel8-11-8-local-11.8.0_520.61.05-1.x86_64.rpm

なファイルを取得している. これから必要なライブラリは

yum localinstall cuda-repo-rhel7-11-7-local-11.7.0_515.43.04-1.x86_64.rpm
 
yum install cuda-toolkit-11-7

と「cuda-toolkit-」のみを入れている


トップ   編集 添付 複製 名前変更     ヘルプ   最終更新のRSS
Last-modified: 2022-10-21 (金) 22:09:42 (37d)