前言

之前搭建好的服务器崩溃掉了,原因是3080ti对Ubuntu21.04的兼容性不好,开机进不了图形界面了,进入黑窗只有左上角有个输入光标。所以尝试在Ubuntu21.10最新版本上安装最新的板卡驱动以及CUDA
由于某些原因,搭建的时候无法连接国外IP,本文提供的下载地址全部是国内的网站或镜像站

正文

首先重新安装Ubuntu,准备一个U盘,使用U盘启动工具制作启动盘
这里我用的是VentoyVentoy是一款开源免费的ISO/WIM/IMG/VHD(x)/EFI启动工具

Ventoy的官网选择从镜像站下载,下载后写入到U盘即可
然后下载Ubuntu21.10的镜像文件,这里选择从镜像站下载,如清华大学开源软件镜像站

下载完成直接放到U盘里即可
然后在服务器插入U盘,载入镜像安装文件
注意在分区的时候,由于服务器是512G固态+2T机械
所以按如下列表分区
固态硬盘

名称分配大小类型备注
EFI200MB自动确定如果电脑时单系统,一定要配置;双系统则无需配置
/204800MBExt4系统盘大小, 200GB 为佳
自动确定65536MB交换空间一般和电脑内存一样大,64GB 为佳
/home剩下所有内存Ext4一些用户软件会在这里安装

机械硬盘

名称分配大小类型备注
/home/data2TEXT4

显卡驱动
显卡驱动有三种安装方式:Ubuntu的软件和更新安装,CUDA安装的同时安装,手动安装
我在安装的时候,为了防止出错,选择了手动安装
先切换至开源驱动[X.Org X server]

然后下载.run格式的Nvidia驱动程序
从国内的服务器下载,下载地址
注意
Nvidia在国内有服务器,需要手动修改域名,将.com修改为.cn
把文件拷贝到/home下备用

  • 卸载系统自动安装的驱动和CUDA

    sudo apt-get --purge remove nvidia-*
    sudo apt-get --purge remove "*nvidia*"
    sudo apt-get remove cuda
    sudo apt autoremove 
    sudo apt-get remove cuda*
    
  • 安装必要的依赖

    sudo apt-get install gcc make
    sudo apt-get install lightdm
    
  • 禁用 nouveau

    sudo gedit /etc/modprobe.d/blacklist.conf 
    

    在文件最后一行加入

    blacklist nouveau
    options nouveau modeset=0
    

    更新内核

    sudo update-initramfs -u
    

    重启系统

    reboot
    

    重启之后, 验证 nouveau是否已被禁用

    lsmod | grep nouveau
    

    无输出则成功禁用

  • 关闭 lightdm

    sudo service lightdm stop
    

安装显卡驱动

  • 找到之前在 /home 中保存的 NVIDIA-*.run 文件
  • 运行

    sudo bash NVIDIA-*.run
  • 安装过程中32-bit 库 选择 No, restart X service 选择 Yes
  • 完成后验证:

    nvidia-smi
    

注意
如果重启后进不了图形界面,进入黑窗只有左上角有个输入光标,请在开机时,按ESC,选择ubuntu,按E,编辑启动配置 在quite splash 后面加上nomodeset参数,并按F10启动系统,进入系统后重装驱动
安装CUDA

  • CUDA下载
    打开CUDA官方下载站点
    注意
    Nvidia在国内有服务器,需要手动修改域名,将.com修改为.cn
    下载Latest Release版本

    选择对应版本
    注意
    wget后面的下载链接的.com要改为.cn
    下载后运行安装
    注意
    安装过程中要把Driver的x号取消掉
    因为已经安装过驱动了,CUDA包里的驱动可能会比安装的驱动版本低,驱动不允许降级安装,不取消勾选会导致安装报错
  • 安装结果
  • 添加环境变量

    export PATH=/usr/local/cuda-11.6/bin:$PATH
    export LD_LIBRARY_PATH=/usr/local/cuda11.6/lib64:$LD_LIBRARY_PATH
    source /etc/profile
  • 检查安装结果

总结

安装过程中因为环境差异踩了不少坑,这篇文章中的内容已经是踩完坑后的精华了!

最后修改:2022 年 04 月 19 日
请随意赞赏