104

ubuntu22.04 安装英伟达nvidia驱动 笔记

乐果   发表于   2024 年 03 月 16 日 标签:ubuntu

因为很多 Ai 模型基于英伟达显卡的 cuda,之前的电脑都没有英伟达显卡,所以最近特意买了 一款英伟达显卡的笔记本捣腾。

前几天笔记本刚买回来,为了节省时间直接把 nuc(inter显卡)mini主机的 ssd 硬盘插过来, 但安装 nvidia 时一直报错,可能因为原系统依赖各种不匹配导致的,于是最终还是重装了 ubuntu 系统。

今天终于在新安装的 ubuntu22.04 版本系统下将它搞定了。

安装步骤

首先去官网下载驱动程序:nvidia

如下图,选择对应的显卡型号(例如我笔记本为 Rtx4060 ):

卸载旧驱动

$ sudo apt-get remove --purge nvidia*
# 若安装失败也是这样卸载以及
$ sudo chmod a+x NVIDIA-Linux-x86_64-440.44.run
# 给予可执行权限
$ sudo sh NVIDIA-Linux-x86_64-440.44.run --uninstall #确保卸载干净。

禁用nouveau驱动

Nouveau是由第三方为NVIDIA显卡开发的一个开源3D驱动,为了让用户安装完系统即可进入桌面,因此很多Linux发行版默认集成了Nouveau驱动。但是Nouveau驱动会影响安装NVIDIA官方驱动,因此在安装前要先禁用Nouveau驱动。

/etc/modprobe.d/blacklist.conf 配置文件下增加一行:

blacklist nouveau

完成后,重启机器……

开始安装

进入存放run文件的目录,执行以下命令:

$ sudo sh NVIDIA-Linux-x86_64-550.54.14.run -no-x-check -no-nouveau-check -no-opengl-files

本来安装 Nvidia驱动需要关闭 nouveau 驱动和图形界面,加上后面的参数后就不需要那么繁琐,最后一个opengl的参数十分关键,不加上去有可能安装过后重启时会出现循环登录。

安装过程:

1. There appears to already be a driver installed on your system (version:      
  390.42).  As part of installing this driver (version: 390.42), the existing  
  driver will be uninstalled.  Are you sure you want to continue?

                 Continue installation      Abort installation 

(选择 Coninue,如果是重装的话)
2. The distribution-provided pre-install script failed!  Are you sure you want
  to continue?                                                                 

                 Continue installation      Abort installation       
(选择 Cotinue)
3. Would you like to register the kernel module sources with DKMS? This will    
  allow DKMS to automatically build a new module, if you install a different   
  kernel later.

                          Yes                       No  
(这里选 No)
4. Install NVIDIA's 32-bit compatibility libraries?

                          Yes                       No  
(这里选 No)
5. Installation of the kernel module for the NVIDIA Accelerated Graphics Driver
  for Linux-x86_64 (version 390.42) is now complete.                           

                                       OK

如果能出现第五条,那恭喜,您已成功安装NVIDIA驱动。重启后执行:

$ nvidia-smi

可以看到类似如下的内容:

$ nvidia-smi
Mon Mar 18 16:09:16 2024       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.14              Driver Version: 550.54.14      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 4060 ...    Off |   00000000:01:00.0 Off |                  N/A |
| N/A   43C    P0             N/A /   70W |       8MiB /   8188MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                                                         
+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|    0   N/A  N/A      1902      G   /usr/lib/xorg/Xorg                              4MiB |
+-----------------------------------------------------------------------------------------+

安装可能不会很顺利

具体可以根据提示排查问题,我在安装时发现需要注意如下几个问题:

  • gcc编译器版本要12,可以用命令行 gcc --version 查看当前版本,如果低于12则要升级到12版本;
  • 要把主板bios的设置选项 secerity boot 关闭;

gcc版本如下:

$ gcc --version
gcc (Ubuntu 12.3.0-1ubuntu1~22.04) 12.3.0
Copyright (C) 2022 Free Software Foundation, Inc.
This is free software; see the source for copying conditions.  There is NO
warranty; not even for MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.

注意,每个人遇到问题可能会不一样,我显卡是 Rtx4060 ,官方下载的驱动为:NVIDIA-Linux-x86_64-550.54.14.run

乐果   发表于   2024 年 03 月 16 日 标签:ubuntu

0

文章评论