nvidiaドライバを入れてみる
nvidiaドライバは、
の2つの経路があるのかなと思っている.
片方はドライバのみ、もう片方はcudaライブラリと共にnvidiaドライバをインストール.
前者を選ぶとcudaライブラリがインストールできないわけではない. あとで必要なcudaライブラリのみを入れればいい.
前者の利点は、最新のnvidiaドライバが利用できる. 後者は「どうせ後からcudaライブラリも使うから一緒に」なシーンかな.
anaconda/minicondaで構築するアプリは「nvidiaドライバ」のみでいい. なぜなら必要なcudaライブラリをcondaコマンドらで
cudatoolkitらの名前で自ら引き込むので. relionとかはそのソースしか提供しないので別途cudaライブラリを用意しておく必要がある.
なのでcryoSPARCも「nvidiaドライバ」さえ入っていればいい
ではnvidiaドライバを淹れてみる.
現状確認
[root@centos7 ~]# uname -r
3.10.0-1160.el7.x86_64
[root@centos7 ~]# lspci -v |grep NVIDIA
13:00.0 VGA compatible controller: NVIDIA Corporation Device 2531 (rev a1) (prog-if 00 [VGA controller])
Subsystem: NVIDIA Corporation Device 151d
[root@centos7 ~]#
GUI環境のログイン画面であると、nvidiaドライバのインストール時に怒られる場合があるので、CUI環境モードに移行させておく
「systemctl isolate multi-user.target」の後で「rmmod nouveau」でもいいけど
[root@centos7 ~]# systemctl set-default multi-user.target
っで次に開発環境を用意する.
[root@centos7 ~]# yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
[root@centos7 ~]# yum groupinstall "Development Tools"
[root@centos7 ~]# yum install epel-release
[root@centos7 ~]# yum install dkms
あと、boot段階でnouveauを排除するようにしてからreboot
[root@centos7 ~]# vi /etc/default/grub
:
GRUB_CMDLINE_LINUX="crashkernel=auto rhgb quiet"
↓
GRUB_CMDLINE_LINUX="crashkernel=auto rhgb quiet nouveau.modeset=0 modprobe.blacklist=nouveau"
:
[root@centos7 ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
[root@centos7 ~]# grub2-mkconfig -o /boot/efi/EFI/centos/grub.cfg
[root@centos7 ~]# reboot
boot後に「lsmod | grep nouveau」でnouveauがないことを確認します
[root@centos7 ~]# lsmod | grep nouveau
っでnvidiaドライバをインストール
[root@centos7 ~]# bash NVIDIA-Linux-x86_64-515.76.run --disable-nouveau --no-opengl-files --no-libglx-indirect --dkms
For some distributions, Nouveau can be disabled by adding a file in the modprobe configuration directory.
--> Yes -> OK
Would you like to register the kernel module sources with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later.
--> Yes
Install NVIDIA's 32-bit compatibility libraries?
--> No
Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X driver will be used when you restart X?
--> No -> OK
(ここをYesで選択したら「rm /etc/X11/xorg.conf」で削除. これがあるとXが正しく動かない)
[root@centos7 ~]#
確認は「nvidia-smi」が正しく出力されたら.
[root@centos7 ~]# nvidia-smi
あとはGUI環境に戻すとかで
[root@centos7 ~]# systemctl set-default graphical.target
[root@centos7 ~]# reboot
これで上手く行くみたい
ほか確認方法として「lshw」とかでも
[root@centos7 ~]# lshw -class display
*-display
description: VGA compatible controller
product: SVGA II Adapter
vendor: VMware
physical id: f
bus info: pci@0000:00:0f.0
version: 00
width: 32 bits
clock: 33MHz
capabilities: vga_controller bus_master cap_list rom
configuration: driver=vmwgfx latency=64
resources: irq:16 ioport:2040(size=16) memory:e8000000-efffffff memory:f9000000-f97fffff memory:ff300000-ff307fff
*-display
description: VGA compatible controller
product: NVIDIA Corporation
vendor: NVIDIA Corporation
physical id: 0
bus info: pci@0000:13:00.0
version: a1
width: 64 bits
clock: 33MHz
capabilities: pm msi pciexpress vga_controller bus_master cap_list
configuration: driver=nvidia latency=248
resources: irq:65 memory:fb000000-fbffffff memory:c0000000-cfffffff memory:d0000000-d1ffffff ioport:3000(size=128)
[root@centos7 ~]#
とか
削除 †
nvidiaドライバをインストールしたからには削除も明記する必要があるかなと。コマンド「nvidia-uninstall」を使います.
[root@centos7 ~]# nvidia-uninstall
If you plan to no longer use the NVIDIA driver, you should make sure that no X screens are configured to use the NVIDIA X driver in your X configuration file.
--> No -> OK
[root@centos7 ~]# reboot
nvidiaドライバのバージョンとCUDAライブラリ †
これが正しいかは不明ですが、各種nvidiaドライバを入れて、nvidia-smiを叩いて「CUDA Version:」の値を調べた
Driver Version | CUDA Version | メモ |
525.60.11 | 12.0 | RTX40x0対応 |
520.56.06 | 11.8 | RTX4090対応のはじめ |
515.76 | 11.7 | |
515.65.01 | 11.7 | |
510.85.02 | 11.6 | |
510.47.03 | 11.6 | |
470.141.03 | 11.4 | Keplerの上限 |
RTX40x0を搭載するには520以上が必要. 520は新機能ブランチでNVIDIAの推奨である525以降を使った方がいいのかも
nvidiaドライバをインストールしてからcudaライブラリをインストール †
https://developer.nvidia.com/cuda-downloads
から必要なcudaライブラリを入手します
こちらでは「 rpm (local) 」なファイル、
cuda-repo-rhel8-11-7-local-11.7.0_515.43.04-1.x86_64.rpm
とか
cuda-repo-rhel8-11-8-local-11.8.0_520.61.05-1.x86_64.rpm
なファイルを取得している. これから必要なライブラリは
yum localinstall cuda-repo-rhel7-11-7-local-11.7.0_515.43.04-1.x86_64.rpm
yum install cuda-toolkit-11-7
と「cuda-toolkit-<バージョン>」のみを淹れる
ubuntuでnvidiaドライバを †
大抵はaptなんとかでnvidiaドライバのインストールはできるようですが、ここでは上のCentOSのように組み込みたいとおもう
root@ubuntu22:~# uname -r
5.19.0-35-generic
root@ubuntu22:~# cat /etc/os-release
PRETTY_NAME="Ubuntu 22.04.2 LTS"
:
root@ubuntu22:~# apt install build-essential dkms
root@ubuntu22:~# vi /etc/default/grub
:
GRUB_CMDLINE_LINUX=""
↓
GRUB_CMDLINE_LINUX="nouveau.modeset=0 modprobe.blacklist=nouveau"
:
root@ubuntu22:~# update-grub
root@ubuntu22:~# systemctl set-default multi-user.target
root@ubuntu22:~# reboot
lsmodでnouveauがないことを確認して、
root@ubuntu22:~# lsmod |grep nouveau
その後にnvidiaドライバをインストールします
root@ubuntu22:~# bash /Public/cuda/NVIDIA-Linux-x86_64-525.60.11.run --disable-nouveau --no-opengl-files --no-libglx-indirect --dkms
root@ubuntu22:~# systemctl set-default graphical.target
root@ubuntu22:~# reboot
persistence mode †
nvidia-smiと実行してしばらくして結果が表示される. これは nvidiaドライバがロードされてなく、nvidia-smiの実行で呼び込まれたからワンテンポ遅れて表示されるそうな
・・・でもlsmodでみるとnvidia.koはkernelに組み込まれている. それとは違った所での「ロード」なのだろうか?まぁそれはいいとして、
っでこの「ワンテンポ遅れる」のをさせず即座に応答させるには「persistence mode」を有効にするといいみたい。
現在の状態はというと
[root@centos7 ~]# nvidia-smi -q | grep "Persistence Mode"
Persistence Mode : Disabled
[root@centos7 ~]#
と「Disabled」と無効となっている。これを有効にするには「nvidia-smi -pm 1」と実行する
[root@centos7 ~]# nvidia-smi -pm 1
Enabled persistence mode for GPU 00000000:13:00.0.
All done.
[root@centos7 ~]# nvidia-smi -q | grep "Persistence Mode"
Persistence Mode : Enabled
[root@centos7 ~]#
っがどうやらこの方法はレガシーな方法のようで、今はもっとエレガントらしい。
参照先https://download.nvidia.com/XFree86/Linux-x86_64/510.47.03/README/nvidia-persistenced.html
ここから下記の中でnvidiaドライバと同じバージョンのソースを取得します
https://download.nvidia.com/XFree86/nvidia-persistenced/
ここでは
[root@centos7 ~]# nvidia-smi -q | grep "Driver Version"
Driver Version : 510.47.03
[root@centos7 ~]#
なので「nvidia-persistenced-510.47.03.tar.bz2」を取得します
[root@centos7 ~]# tar xf nvidia-persistenced-510.47.03.tar.bz2
[root@centos7 ~]# cd nvidia-persistenced-510.47.03/
[root@centos7 nvidia-persistenced-510.47.03]#
[root@centos7 nvidia-persistenced-510.47.03]# make
CC command_server.c
CC nvidia-persistenced.c
CC options.c
CC nvidia-syslog-utils.c
CC nvpd_rpc_server.c
CC nvpd_rpc_xdr.c
CC nvidia-numa.c
CC common-utils/nvgetopt.c
CC common-utils/common-utils.c
CC common-utils/msg.c
LINK _out/Linux_x86_64/nvidia-persistenced.unstripped
STRIP _out/Linux_x86_64/nvidia-persistenced
HOST_CC gen-manpage-opts.c
HOST_CC common-utils/gen-manpage-opts-helper.c
HOST_LINK root/nvidia-persistenced-510.47.03/_out/Linux_x86_64/gen-manpage-opts
M4 nvidia-persistenced.1.m4
gzip -9nf < _out/Linux_x86_64/nvidia-persistenced.1 > _out/Linux_x86_64/nvidia-persistenced.1.gz
rm _out/Linux_x86_64/nvidia-persistenced.unstripped
[root@centos7 nvidia-persistenced-510.47.03]# make install
mkdir -p /usr/local/bin
install -m 755 _out/Linux_x86_64/nvidia-persistenced /usr/local/bin/nvidia-persistenced
mkdir -p /usr/local/share/man/man1
install -m 755 _out/Linux_x86_64/nvidia-persistenced.1.gz /usr/local/share/man/man1/nvidia-persistenced.1.gz
[root@centos7 nvidia-persistenced-510.47.03]#
これで「nvidia-persistenced」さんなる新たなユーザが作られて
[root@centos7 ~]# systemctl list-unit-files | grep nvidia
nvidia-hibernate.service disabled
nvidia-persistenced.service disabled
nvidia-powerd.service disabled
nvidia-resume.service disabled
nvidia-suspend.service disabled
[root@centos7 ~]#
とご丁寧にdaemonが用意される。ここでは「nvidia-persistenced.service」を有効にして、起動時に動くようにします
[root@centos7 ~]# systemctl enable nvidia-persistenced.service
[root@centos7 ~]# systemctl restart nvidia-persistenced.service
#node(nonumber){{
dnf install nvidia-persistenced.x86_64
}}