admin管理员组

文章数量:1130349

【腾讯文档】深度学习环境安装指南
https://docs.qq/slide/DU3ZWR1FYb05CR3dS
1. Anaconda安装

官网进行账号注册后下载 Linux与系统匹配的Anaconda3版本,此处我下载了 Anaconda3-2024.10-1-Linux-x86_64.sh,因为我的系统是Ubuntu20.04 x86架构的。在该软件目录打开终端或cd到该目录,利用命令执行

/bin/bash Anaconda3-2024.10-1-Linux-x86_64.sh

然后不断按enter键,全选yes。(我安装时最后一个问题选了no,就是不自启动conda的base环境,导致我的conda命令是无命令的,最后使用命令 才开启)

conda config --set auto_activate_base true

然后进行初始化conda,采用一下命令进行初始化,就会在路径中添加环境,然后关掉终端,就可以在新开的终端使用了
 

conda init

source ~/.bashrc

由于Ubuntu软件是没有桌面图标的,我参考该 文章 创建了一个,方便使用,当然也可以使用命令启动

anaconda-navigator

在桌面创建一个文本文件,输入

[Desktop Entry]

Name=Anaconda

Version=1.0

Type=Application

Exec=/home/pc/anaconda3/bin/anaconda-navigator

Icon=/home/pc/anaconda3/pkgs/anaconda-navigator-1.6.8-py36_0/lib/python3.6/site-packages/anaconda_navigator/static/images/anaconda-icon-256x256.png
#(这两行根据你的路径进行修改,我找图片时也与参考文章不太一样)
#(是Icon=/home/pc/anaconda3/pkgs/anaconda-navigator-2.6.3-py312h06a4308_0/lib/python3.12/site-packages/anaconda_navigator/static/images/common/anaconda-icon-256x256.png)

Terminal=false

StartupNotify=true

同时可能图片没有权限,导致无法执行,因此

chmod 777 /home/pc/anaconda3/pkgs/anaconda-navigator-2.6.3-py312h06a4308_0/lib/python3.12/site-packages/anaconda_navigator/static/images/common/anaconda-icon-256x256.png

然后右击打开就行

自此Anaconda3就安装完成了

2.CUDA与cuDNN安装

与我在windows系统安装的版本一样,由于我的ubuntu系统NVIDIA驱动是550.120,支持的最高CUDA版本是12.4,因此我咨询AI的结果是稳定的版本组合是  CUDA Toolkot 11.8  ,  cuDNN 9.1.0.70  ,  pythorch 2.5.1 



 CUDA安装 



直接在crt+ALT+T的终端里输入选择后的安装代码



输入sh安装命令,因为已有驱动,所以得选择卸掉驱动再安装





这里提示我没有gcc编译器,没办法安装,因此通过以下命令安装gcc编译器和其他编译器



sudo apt install build-essential

重新运行

sudo sh cuda_11.8.0_520.61.05_linux.run

协议输入accept,然后因为电脑已经安装了驱动,所以按空格取消第一行的驱动Driver,如果要进行分布式计算,可以加上组件nvidia-fs,然后选择Install



安装完成,通过nvcc -V验证



 cuDNN安装 

下载cuDNN











检查cuDNN安装情况



3.  pytorch安装 



安装完成,这是base环境里的torch版本

如果要用其他版本的cuda和pytorch,应该先建立虚拟环境再安装对应版本的pytorch,因为新环境不会继承base环境的包

# 创建环境(Python版本需与PyTorch兼容)

conda create -n deeplearn python=3.12

conda activate deeplearn


# 安装指定CUDA版本的PyTorch

conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=11.8 -c pytorch -c nvidia
4. VScode配置opencv

vscode在扩展中安装python



使用conda创建一个虚拟环境并激活该虚拟环境

conda create -n deeplearning python=3.12

conda activate deeplearning



在deeplearning这个虚拟环境中可以安装各种包,如

pip insatll numpy
5. 重新启动nvidia驱动

还记得在安装cuda时采用了无驱动安装吗,因为当时取消了驱动,所以即使安装完使用pytorch训练时依旧会使用cpu进行训练,而不是GPU,因此得重新安装并重启系统





【腾讯文档】深度学习环境安装指南
https://docs.qq/slide/DU3ZWR1FYb05CR3dS
1. Anaconda安装

官网进行账号注册后下载 Linux与系统匹配的Anaconda3版本,此处我下载了 Anaconda3-2024.10-1-Linux-x86_64.sh,因为我的系统是Ubuntu20.04 x86架构的。在该软件目录打开终端或cd到该目录,利用命令执行

/bin/bash Anaconda3-2024.10-1-Linux-x86_64.sh

然后不断按enter键,全选yes。(我安装时最后一个问题选了no,就是不自启动conda的base环境,导致我的conda命令是无命令的,最后使用命令 才开启)

conda config --set auto_activate_base true

然后进行初始化conda,采用一下命令进行初始化,就会在路径中添加环境,然后关掉终端,就可以在新开的终端使用了
 

conda init

source ~/.bashrc

由于Ubuntu软件是没有桌面图标的,我参考该 文章 创建了一个,方便使用,当然也可以使用命令启动

anaconda-navigator

在桌面创建一个文本文件,输入

[Desktop Entry]

Name=Anaconda

Version=1.0

Type=Application

Exec=/home/pc/anaconda3/bin/anaconda-navigator

Icon=/home/pc/anaconda3/pkgs/anaconda-navigator-1.6.8-py36_0/lib/python3.6/site-packages/anaconda_navigator/static/images/anaconda-icon-256x256.png
#(这两行根据你的路径进行修改,我找图片时也与参考文章不太一样)
#(是Icon=/home/pc/anaconda3/pkgs/anaconda-navigator-2.6.3-py312h06a4308_0/lib/python3.12/site-packages/anaconda_navigator/static/images/common/anaconda-icon-256x256.png)

Terminal=false

StartupNotify=true

同时可能图片没有权限,导致无法执行,因此

chmod 777 /home/pc/anaconda3/pkgs/anaconda-navigator-2.6.3-py312h06a4308_0/lib/python3.12/site-packages/anaconda_navigator/static/images/common/anaconda-icon-256x256.png

然后右击打开就行

自此Anaconda3就安装完成了

2.CUDA与cuDNN安装

与我在windows系统安装的版本一样,由于我的ubuntu系统NVIDIA驱动是550.120,支持的最高CUDA版本是12.4,因此我咨询AI的结果是稳定的版本组合是  CUDA Toolkot 11.8  ,  cuDNN 9.1.0.70  ,  pythorch 2.5.1 



 CUDA安装 



直接在crt+ALT+T的终端里输入选择后的安装代码



输入sh安装命令,因为已有驱动,所以得选择卸掉驱动再安装





这里提示我没有gcc编译器,没办法安装,因此通过以下命令安装gcc编译器和其他编译器



sudo apt install build-essential

重新运行

sudo sh cuda_11.8.0_520.61.05_linux.run

协议输入accept,然后因为电脑已经安装了驱动,所以按空格取消第一行的驱动Driver,如果要进行分布式计算,可以加上组件nvidia-fs,然后选择Install



安装完成,通过nvcc -V验证



 cuDNN安装 

下载cuDNN











检查cuDNN安装情况



3.  pytorch安装 



安装完成,这是base环境里的torch版本

如果要用其他版本的cuda和pytorch,应该先建立虚拟环境再安装对应版本的pytorch,因为新环境不会继承base环境的包

# 创建环境(Python版本需与PyTorch兼容)

conda create -n deeplearn python=3.12

conda activate deeplearn


# 安装指定CUDA版本的PyTorch

conda install pytorch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 pytorch-cuda=11.8 -c pytorch -c nvidia
4. VScode配置opencv

vscode在扩展中安装python



使用conda创建一个虚拟环境并激活该虚拟环境

conda create -n deeplearning python=3.12

conda activate deeplearning



在deeplearning这个虚拟环境中可以安装各种包,如

pip insatll numpy
5. 重新启动nvidia驱动

还记得在安装cuda时采用了无驱动安装吗,因为当时取消了驱动,所以即使安装完使用pytorch训练时依旧会使用cpu进行训练,而不是GPU,因此得重新安装并重启系统





本文标签: 深度环境系统Ubuntu