一。写在前面(必看)
1.本文档将指引您安装以下软件
1.1 miniconda环境安装
1.2 显卡驱动安装
1.3 CUDA安装
1.4 pytorch安装
1.5 jupyter安装
2.根据pytorch版本,确定CUDA版本,python版本
3.根据tensorflow版本,确定CUDA版本,CUDNN版本,python版本
二。环境安装
一。安装前准备
1.apt更新
执行命令:apt update
2.根据自己需要,修改apt镜像源(一般无需修改)
3.确定python版本
二。miniconda安装设置环境变量
1.miniconda的选择
根据您需要的python版本,下载miniconda
2.miniconda安装
我们以python3.9为例,进行演示。
例如安装包名为:Miniconda3-py39_4.12.0-Linux-x86_64。请根据实际下载名称修改
1.下载(根据需要二选一):
官网下载:wget https://repo.anaconda.com/miniconda/Miniconda3-py39_4.12.0-Linux-x86_64.sh
推荐闪电云内网下载:wget http://172.168.200.101/miniconda/Miniconda3-py39_4.12.0-Linux-x86_64.sh
2.安装:sh Miniconda3-py39_4.12.0-Linux-x86_64.sh
步骤:
回车
yes
回车
yes(切记,默认是no)
#进入环境
source ~/miniconda3/bin/activate
三。显卡驱动安装
1.显卡驱动版本的选择
使用命令:ubuntu-drivers devices 可以查看系统推荐的显卡版本。
我们一般选择最新版本。此处我们选择nvidia-driver-550
2.显卡驱动安装
使用命令:sudo apt-get install nvidia-driver-550
四。CUDA安装
1.CUDA版本选择(根据需要二选一)
闪电云版本列表:http://172.168.200.101/cuda/
2.CUDA安装
我们以比较通用的CUDA11.8为例进行演示cuda_11.8.0_520.61.05_linux名称根据实际版本修改
官网下载:wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run
推荐闪电云内网下载:wget http://172.168.200.101/cuda/cuda_11.8.0_520.61.05_linux.run
2.安装
1.执行安装命令:
sudo sh cuda_11.8.0_520.61.05_linux.run(执行后大概需要20秒等待)
1.1 选择continue
1.2 输入accept
1.3 用键盘上下键,配合空格键,选择安装包。我们只选择CUDA Toolkit 11.8即可
1.4 选择Install并回车
1.5 等待安装完成
2.添加环境变量:
添加环境变量(如果在conda里)
echo "export PATH=/usr/local/cuda-11.8/bin${PATH:+:${PATH}}" >> ~/.bashrc
echo "export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}" >> ~/.bashrc
sudo ldconfig载入安装后的动态链接库
source ~/.bashrc 使环境变量生效
测试安装情况
nvcc -V
五。pytorch安装
1.版本选择
我们以pytorch2.3.0为例进行演示
2.安装命令
六。tensorflow安装
1.安装clang(tensorflow2.13.0以下版本忽略)
wget https://apt.llvm.org/llvm-snapshot.gpg.key
sudo apt-key add llvm-snapshot.gpg.key
#根据你的 Ubuntu 版本选择正确的仓库。假设你是使用 Ubuntu 22.04(Jammy),命令如下:
sudo add-apt-repository "deb https://apt.llvm.org/jammy/ llvm-toolchain-jammy-17 main"
#如果你使用的是其他版本,请将 jammy 替换为对应的代号(例如 focal 对应 20.04)。
sudo apt update
sudo apt install clang-16
2.安装cudnn
wget "http://172.168.200.101/cudnn/cudnn-linux-x86_64-8.7.0.84_cuda11-archive.tar.xz" -O cudnn.tar.xz
tar xvf cudnn.tar.xz
sudo cp cudnn-*-archive/include/cudnn*.h /usr/local/cuda/include
sudo cp cudnn-*-archive/lib/libcudnn* /usr/local/cuda/lib64
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
3.安装tensorflow
pip install tensorflow==2.14.0 -i https://mirrors.huaweicloud.com/artifactory/pypi-public/simple/
4.验证安装
python -c "import tensorflow as tf;print(tf.reduce_sum(tf.random.normal([1000, 1000])))"
七。jupyter安装
1.安装
pip install jupyterlab -i https://mirrors.aliyun.com/pypi/simple/
2.设置
jupyter lab --generate-config
3.修改配置
vim .jupyter/jupyter_lab_config.py
# jupyter_notebook_config.py
c.NotebookApp.ip = '0.0.0.0' # 绑定所有接口
c.NotebookApp.open_browser = False # 不自动打开浏览器
c.NotebookApp.port = 8888 # 监听端口
c.NotebookApp.allow_remote_access = True # 允许远程访问
4.启动
后台启动
nohup jupyter lab --allow-root &> jupyterlab.log &
前台启动
jupyter lab --allow-root
#查看token
jupyter lab list
5.外部连接jupyter







