机器学习模型训练环境
编程环境
安装包安装
如果你想用python的安装包的话,直接去官网下载:点我下载
Windows
https://www.python.org/downloads/windows
安装方式:双击exe文件
安装即可,如安装过程中有添加环境变量
选项,勾选即可,否则安装完成后需要自行配置环境变量。
Linux
安装Python之前需要安装(否则有的地方还需要安装,会报错,需要重新编译)
1
2
3
4
5 yum -y install libffi-devel
yum -y groupinstall "Development tools"
yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel
CentOS一键安装Python脚本
需要将对应的Python安装包放在脚本同目录下,并修改脚本中安装的Python的文件名(无文件后缀)
下载地址:https://www.python.org/downloads/source/
选择对应版本,这里以Python-3.8.0为例,点我下载
1 | source ~/.bashrc |
Anaconda
Windows安装Anaconda
使用Anaconda集成环境,便于不同版本的项目创建不同的虚拟环境。
Anaconda下载地址:点我下载
Miniconda下载地址:点我下载
下载后安装,记得勾选:
Add Anaconda3 to my PATH environment variable
或者手动将Anaconda的环境变量添加进系统PATH中
安装完成后,打开cmd控制台,输入 conda -V
查看是否安装成功。
控制台输出以下内容,表示成功。
1 | conda 23.7.2 |
Linux安装Anaconda
1 | # 下载 |
本人通过虚拟机安装时遇到过name or service not known
错误,和上面安装无关,这是我虚拟机的问题,这里记录下解决方式。
1 | vi /etc/resolv.conf |
配置清华镜像源
配置清华镜像源后,国内下载依赖包速度会大大增加。
使用 conda 配置添加channels信息。
1 | # 使用conda配置添加channels信息 |
conda 恢复channel的默认设置
1 | conda config --remove-key channels |
创建python虚拟环境
打开cmd控制台,输入以下命令:
1 | # 其中env_name表示虚拟环境的名称 |
以上操作也可使用Anaconda可视化界面软件完成。
Anaconda安装完成后,自带可视化软件。
Jupyter配可切换置虚拟环境
1 | # 1、在base环境,终端执行以下命令 |
常用Conda命令
1 | # 查看conda版本,验证是否安装 |
以上安装依赖包的命令使用pip也可以。
常用pip命令
1 | # 要是觉得自己的pip版本有点低,想要升级一下的话 |
pip换源
如果你没有用Anaconda,而是直接使用安装包安装的python。
pip配置稳定的国内镜像源
清华:https://pypi.tuna.tsinghua.edu.cn/simple
阿里云:http://mirrors.aliyun.com/pypi/simple/
华为云:https://repo.huaweicloud.com/repository/pypi/simple
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
华中理工大学:http://pypi.hustunique.com/
山东理工大学:http://pypi.sdutlinux.org/
方法1(永久更改)
进入我的电脑,输入
1 | %APPDATA% |
按下回车,自动转到一个文件夹
在这里,我们新建一个文件夹,命名为pip
在这个文件夹里,新建pip.ini文件,内容:
1 | [global] |
方法2(永久更改)
1 | pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple/ |
方法3(临时性使用)
1 | pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple/ |
Pycharm
Pycharm中文网:点我查看
Pycharm历史版本下载(建议2021.3.1):点我去下载
Pycharm破解:点我查看
Pycharm设置python解释器
使用Anaconda虚拟环境
选择好了以后,将对应的python解释器设置为当前项目的主解释器。
New Project
新建项目
模型训练环境
安装cuda和cudnn
本次环境搭建基于单卡GPU环境,使用的显卡为3070Ti。
首先输入以下命令查看显卡驱动以及cuda支持的版本。
1 | nvidia-smi.exe |
输出了形如以下的内容
1 | C:\Users\xiaojingge>nvidia-smi.exe |
其中 Driver Version 表示显卡驱动版本为545.84,CUDA Version 表示支持的cuda版本为12.3,表明了安装的cuda版本不能大于这个版本。
本次我安装的cuda版本和cudnn版本为:
cuda_11.2.0_460.89_win10.exe
cudnn-11.2-windows-x64-v8.1.1.33
相关下载地址为:
Nvidia驱动下载地址:https://www.nvidia.cn/geforce/drivers/
Cuda下载地址:https://developer.nvidia.com/cuda-toolkit-archive
Cudnn下载地址:https://developer.nvidia.com/rdp/cudnn-archive
注意:cudnn下载要求必须登录nvidia账号,可以去注册个账号,已有账号的话直接登录即可
。
下载好cuda的安装包后,点击exe文件安装即可。
安装好以后,将对应的路径添加进环境变量中:
安装好cuda以后,系统会自动将 CUDA_PATH 和 CUDA_PATH_V11_2 添加进环境变量。
1 | # 还需要将以下内容添加进path中 |
对于cudnn,只需要将下载的压缩包解压,将对应的文件复制到cuda对应的目录下面即可。
1 | # 一般有三个文件夹 |
完成上述操作后,打开cmd控制台,输入 nvcc -V
,查看对应的cuda版本信息,验证是否安装成功。
1 | C:\Users\xiaojingge> |
安装相关依赖
安装依赖之前,记得安装Anaconda,毕竟是python的集成环境,便于切换虚拟环境,适配各个版本的python,管理等。
安装Tensorflow相关的依赖
30系显卡只支持cuda 11.0及以上版本,但很多tensorflow项目用的仍然是1.1x版本,这些版本需要cuda10或者以下版本,这就导致在30系显卡上无法正常运1.1x版本的tensorflow,最近几天我也因为这个问题头疼不已,网上一番搜索之后发现了一个编译过后可用的tensorflow-gpu-1.15版本,在3070Ti上完美运行,特此记录以防丢失。
先把包放上 点我下载 ,提取码:q28r,下载之后安装这个文件(python版本为3.7)。
1 | # 注意切换到对应虚拟环境中,我创建的虚拟环境名称为:tf1_15_cuda11_2 |
然后使用conda安装对应的依赖包
1 | # 注意切换到对应的虚拟环境中,我创建的虚拟环境名称为:tf1_15_cuda11_2 |
安装成功后,编写测试代码验证是否可用。
1 | import tensorflow as tf |
如果结果打印True表示tensorflow-gpu检测到了GPU,可用。
安装Pytorch相关的依赖
需要安装与当前cuda版本适配的pytorch版本。
1 | # 本人机器安装依赖版本如下 |
经过一段时间就安装好了,安装好了以后可以通过编写python代码验证一下
1 | # 导入torch模块 |
如果输出True就没有问题。