Ubuntu Server 24安装NVIDIA显卡驱动和CUDA

阅读:56

这是一篇关于自己装机并安装驱动的过程记录。

首先U盘安装ubuntu server 系统。安装完之后又一个小小的注意点,看看你的磁盘分区挂载了多少空间。这虽然不影响你暂时的使用,但是后续的使用可能会有一些影响。

使用ssh 链接进入系统之后,先使用df -h查看 / 这个目录的分区占用了多少空间。

1730960482675image.png

(主要是看这里   我是1TB的硬盘   所以应该全部加起来的大小应该在900+GB)

但通常可能并不是硬盘的全部,你可能需要手动扩展分区大小sudo lvextend -L +<扩展的大小>M /dev/<卷组名>/<逻辑卷名> 我这里的示例是:sudo lvextend -L +100G /dev/mapper/ubuntu--vg-ubuntu--lv

这样在后续的执行中当你存放大量文件或者资源的时候不会存在磁盘空间不足的报错。

1、NVIDIA显卡驱动安装

1、1硬件检查

这里只是英伟达的显卡驱动安装,首先检查硬件是否被识别到:

lspci | grep -i nvidia

1730960938809image.png

如果输出了你显卡的型号代表硬件能识别到,虽然你可以通过输入nvidia-smi 的时候apt 会提示你安装一些驱动,但是不建议用apt 安装,这种安装方法大部分时候的驱动是无法使用的,这里就说一下手动安装

1、2驱动下载

直接去英伟达驱动下载官网: https://www.nvidia.cn/drivers/lookup/

按照你显卡的型号进行选择然后下载驱动:

1730961255175image.png

然后点击查找,下载你需要的驱动到服务器中。你可以在支持的产品列表中看到你自己的显卡

1730961382837image.png

1、3编译工具安装

下载完成之后需要先安装一些编译工具:

apt install gcc make

1、4禁用Nouveau 驱动

vi /etc/modprobe.d/blacklist-nouveau.conf

// 插入如下内容
blacklist nouveau
noptions nouveau modeset=0

或者直接在/etc/modprobe.d/blacklist.conf 文件中插入这一段代码
然后重启电脑
reboot;


//重启之后输入如下  如果没有返回则代表禁用成功
lsmod | grep nouveau

1、5驱动安装

下载下来的文件NVIDIA-Linux-x86_64-550.107.02.run 给该文件增加执行权限:

chmod 777 ./NVIDIA-Linux-x86_64-550.107.02.run

// 然后执行驱动文件  一路确认即可安装成功
./NVIDIA-Linux-x86_64-550.107.02.run

// 安装完成之后输入 nvidia-smi  输出如下内容代表安装成功

1730962205320image.png


CUDA安装

cuda 的安装你需要根据 nvidia-smi 输出的cuda版本安装对应的版本   尽量不要安装别的版本,避免兼容问题。我这里需要安装的是12.4的版本。

依然去官网站到你对应的版本然后下载: https://developer.nvidia.com/cuda-toolkit-archive

1730962612631image.png

ubuntu 这里可能没有24的系统版本,但你可以选择22的系统版本下载,按照官网的命令提示直接执行就可以了。

wget https://developer.download.nvidia.com/compute/cuda/12.4.0/local_installers/cuda_12.4.0_550.54.14_linux.run
//这里最好还是给文件加执行权限
chmod 777 ./cuda_12.4.0_550.54.14_linux.run

sudo sh cuda_12.4.0_550.54.14_linux.run

按照提示安装完成之后输入nvcc -V即可查看是否安装成功

1730962798180image.png

检查你的cuda版本和驱动支持的版本相同即可,大功告成。

建议手动安装时应为apt 安装的可能无法使用,而且coda 的版本不一定能对应上,可能存在兼容问题。所以手动安装可以更好的控制。

加载中...