前言
之前搭建好的服务器崩溃掉了,原因是3080ti对Ubuntu21.04的兼容性不好,开机进不了图形界面了,进入黑窗只有左上角有个输入光标。所以尝试在Ubuntu21.10最新版本上安装最新的板卡驱动以及CUDA
由于某些原因,搭建的时候无法连接国外IP,本文提供的下载地址全部是国内的网站或镜像站
正文
首先重新安装Ubuntu,准备一个U盘,使用U盘启动工具制作启动盘
这里我用的是Ventoy,Ventoy是一款开源免费的ISO/WIM/IMG/VHD(x)/EFI启动工具
在Ventoy的官网选择从镜像站下载,下载后写入到U盘即可
然后下载Ubuntu21.10的镜像文件,这里选择从镜像站下载,如清华大学开源软件镜像站
下载完成直接放到U盘里即可
然后在服务器插入U盘,载入镜像安装文件
注意在分区的时候,由于服务器是512G固态+2T机械
所以按如下列表分区
固态硬盘
名称 | 分配大小 | 类型 | 备注 |
---|---|---|---|
EFI | 200MB | 自动确定 | 如果电脑时单系统,一定要配置;双系统则无需配置 |
/ | 204800MB | Ext4 | 系统盘大小, 200GB 为佳 |
自动确定 | 65536MB | 交换空间 | 一般和电脑内存一样大,64GB 为佳 |
/home | 剩下所有内存 | Ext4 | 一些用户软件会在这里安装 |
机械硬盘
名称 | 分配大小 | 类型 | 备注 |
---|---|---|---|
/home/data | 2T | EXT4 |
显卡驱动
显卡驱动有三种安装方式:Ubuntu的软件和更新安装,CUDA安装的同时安装,手动安装
我在安装的时候,为了防止出错,选择了手动安装
先切换至开源驱动[X.Org X server]
然后下载.run格式的Nvidia驱动程序
从国内的服务器下载,下载地址
注意
Nvidia在国内有服务器,需要手动修改域名,将.com修改为.cn
把文件拷贝到/home下备用
卸载系统自动安装的驱动和CUDA
sudo apt-get --purge remove nvidia-* sudo apt-get --purge remove "*nvidia*" sudo apt-get remove cuda sudo apt autoremove sudo apt-get remove cuda*
安装必要的依赖
sudo apt-get install gcc make sudo apt-get install lightdm
禁用 nouveau
sudo gedit /etc/modprobe.d/blacklist.conf
在文件最后一行加入
blacklist nouveau options nouveau modeset=0
更新内核
sudo update-initramfs -u
重启系统
reboot
重启之后, 验证 nouveau是否已被禁用
lsmod | grep nouveau
无输出则成功禁用
关闭 lightdm
sudo service lightdm stop
安装显卡驱动
- 找到之前在 /home 中保存的 NVIDIA-*.run 文件
运行
sudo bash NVIDIA-*.run
- 安装过程中32-bit 库 选择 No, restart X service 选择 Yes
完成后验证:
nvidia-smi
注意
如果重启后进不了图形界面,进入黑窗只有左上角有个输入光标,请在开机时,按ESC,选择ubuntu,按E,编辑启动配置 在quite splash 后面加上nomodeset参数,并按F10启动系统,进入系统后重装驱动
安装CUDA
- CUDA下载
打开CUDA官方下载站点
注意
Nvidia在国内有服务器,需要手动修改域名,将.com修改为.cn
下载Latest Release版本
选择对应版本
注意
wget后面的下载链接的.com要改为.cn
下载后运行安装
注意
安装过程中要把Driver的x号取消掉
因为已经安装过驱动了,CUDA包里的驱动可能会比安装的驱动版本低,驱动不允许降级安装,不取消勾选会导致安装报错 - 安装结果
添加环境变量
export PATH=/usr/local/cuda-11.6/bin:$PATH export LD_LIBRARY_PATH=/usr/local/cuda11.6/lib64:$LD_LIBRARY_PATH source /etc/profile
检查安装结果
总结
安装过程中因为环境差异踩了不少坑,这篇文章中的内容已经是踩完坑后的精华了!