用Windows电脑训练深度学习模型?超详细配置教程来了

posted in: 系统相关 | 0

下载 64 位版本的 安装工具,然后像安装其它 软件一样安装它。一定要勾选询问你是否要将 Conda 和 加入到 PATH 的勾选框。

现在你可以通过以下命令检查 Conda 和 是否安装成功。如果安装成功,则会显示版本号;否则你可能需要再次正确安装 Mini-Conda 并将其加入到 PATH。

> python —versionPython 3.8.3> conda —versionconda 4.8.4

下一步是安装 -,请在命令行界面使用以下命令:

> conda install -y jupyter

你可以通过运行 来验证安装,这会帮你在浏览器上打开 。

设置开发环境

这一步很重要,但很多人会忽视它。使用 这种包含所有已知软件包的工具是可以理解的,但如果要开发自己的项目,真正构建一些东西,你可能还是需要一个专门针对该项目或你的工作性质的定制开发环境。使用专门虚拟环境的另一大优势是你可以将软件包与全局设置隔离开。这样,就算你在该环境中使用软件包时搞错了,你也可以轻松地丢弃它们,而不对全局软件包产生任何影响。

这也能让你灵活地使用任何之前版本的 创建环境。这样,你就可以避免使用那些还不稳定的新特性,之后再根据支持情况选择是否升级。

创建 Conda 环境还算简单。为了方便解释,我创建了一个名为 的环境,你可以将其改为任何名称。我将使用 3.7,因为我知道 对其有很好的支持。顺便一提,这将是安装 的位置,我还会创建一个名为 torch 的环境来安装 。

> conda create --name tensorflow python=3.7

环境创建完成之后,你可以使用以下命令进入该环境,其中的 只是我们之前提供给该环境的名称。

> conda activate tensorflow

进入环境之后,你会在提示框的左边看到类似这样的信息:

windows 7 使用详解_windows7使用方法_天盘缝针的详解使用

如果你没在 上看到这个信息,那么你可能需要先在 初始化 conda 一次:

> conda init powershell

然后,你可能会在左边看到 (base),如上图所示,此时你已不在任何环境中。之后,你再进入任何环境,你应该都会看见环境名。

此外,你还可以在环境中安装 nb 工具,并将其链接到我们之前安装的 。

> conda install nb_conda

要将该环境注册到 ,可运行以下命令:

> python -m ipykernel install --user --name tensorflow --display-name “Python 3.7 (tensorflow)”

要退出 Conda 环境,则运行以下命令:

> conda deactivate

现在按照同样的步骤创建一个名为 torch 的环境:

> conda create --name torch python=3.7> conda activate torch> conda install nb_conda> python -m ipykernel install --user --name torch --display-name “Python 3.7 (torch)”

如果环境设置成功,你可以在环境列表中看到它们。

> conda env list

windows 7 使用详解_天盘缝针的详解使用_windows7使用方法

要验证每个环境是否都已安装了各自的软件包,你可以进入各个环境,执行 conda list,这会显示该环境中已安装的所有软件包。

天盘缝针的详解使用_windows7使用方法_windows 7 使用详解

不要因为这个列表很长而感到困扰。Conda 已经妥善地处理了主要部分和依赖包。

一些 GPU 术语

在安装 GPU 相关软件之前,我们有必要了解这些软件是什么,以及你需要它们的原因。

GPU 驱动:顾名思义,GPU 驱动是让操作系统及程序能使用 GPU 硬件的软件。游戏玩家肯定很熟悉这个。如果你喜欢打游戏,你可能需要让这个软件保持最新以获得最好的游戏体验。

CUDA:简单来说,这是英伟达开发的一个编程接口层,能让你调用 GPU 的指令集及其并行计算单元。

自 2010 年代末的 8 系列 GPU 以来,几乎所有 GPU 都兼容 CUDA。要想了解你的 GPU 是否启用 CUDA,可以访问英伟达的网站。

举个例子,如果你有一台消费级 GPU,不管是 系列还是 Titan 系列,你都可以在下图中看到你的 GPU 是否支持 CUDA。

天盘缝针的详解使用_windows 7 使用详解_windows7使用方法

数据截至 2020 年 9 月,截图仅含部分型号。

如果你的电脑是笔记本,你应该看右边的列表;如果你的电脑是台式机,你显然就该看左边的列表。

之前已经提到,我的 GPU 是右侧列表中的 RTX 2060 Max-Q。另外,你不必在意显卡型号名称是否与该列表中的名称完全匹配,Max-Q 和 Super 的底层架构一样,只在 TDP、CUDA 核及张量核数量方面有一些差异。

比如,不管你的 GPU 是 RTX 2080 Super 还是 2080 Max-Q 又或是 2080 Super Max-Q,看列表中的 RTX 2080 就够了。但如果你的 GPU 是 RTX 或其它加了 Ti 的型号,则说明你的 GPU 是该系列中最高端的那一款,这些 GPU 通常在显存大小和 CUDA 核及张量核数量方面更具优势。

截至 2020 年 9 月,要使用 2.0,显卡计算能力必须高于 3.5,但建议使用计算能力至少为 6 的显卡以获得更好的体验。 2.0 还需要 CUDA 10 版本,而这又进一步要求驱动版本至少为 418.x。

需要的 CUDA 版本至少为 9.2,但也支持 10.1 和 10.2。所需的计算能力至少要高于 3.0。

CuDNN:即 CUDA Deep 软件库,这是一个用于深度神经网络的 GPU 加速原语库。cuDNN 为前向和反向卷积、池化、归一化和激活层等标准例程提供了经过高度微调的实现。

(可选): 是一套用于高性能深度学习接口的 SDK。其包含深度学习接口优化器和运行时优化器,能为深度学习接口应用提供低延迟和高通量的特性。

安装 GPU 驱动

首先,你需要搞清楚所使用的 GPU 型号,而且你的 GPU 必须启用了 CUDA。

如果你还没有安装驱动,你可能需要运行一次 更新,它会自动处理有用软件的安装过程,比如英伟达控制面板。这能帮助你获悉 GPU 的相关信息,还有一些与本文无关的设置。

英伟达控制面板就绪之后,你可以在开始菜单打开它,也可以右键点击桌面,然后选择英伟达控制面板。

打开之后,你可以点击「帮助→系统信息」来查看 GPU 驱动版本。驱动版本号列在「细节」窗口的顶部。

天盘缝针的详解使用_windows 7 使用详解_windows7使用方法

如上图所示,我的驱动版本是 456.x,远超过 418.x 的最低要求,所以我不必安装新驱动。

但你的电脑可能不是这样的。要安装最新版的驱动,可访问 ,然后输入 GPU 信息,下载合适的驱动。

windows7使用方法_windows 7 使用详解_天盘缝针的详解使用

驱动下载完成后,运行安装包,选择快速安装会更轻松。驱动安装完成之后,可使用英伟达控制面板进行验证。

另一个安装驱动的方法是使用英伟达的 应用程序。只要你购买的是主打游戏的电脑,应该都预装了该软件。安装过程很简单。

这一步是可选的。如果你已经按照上面的步骤安装了驱动,或你的电脑没有预装该软件,那就不用在乎这个步骤。

你可在这里下载该程序:,然后跟着安装流程将其安装到电脑上。安装完成,打开它,进入驱动选项卡,检查更新并安装新驱动。你也可以在该应用中查看驱动的版本号。

windows7使用方法_天盘缝针的详解使用_windows 7 使用详解

‍ 演示

现在安装驱动过程中最重要的步骤已经完成,你可以选择手动安装 CUDA 工具包,也可以选择在安装 或 时留给 Conda 来安装(强烈推荐后者)。

如果决定手动安装,你可以从这里下载安装包:,然后跟着指示操作即可。

windows7使用方法_windows 7 使用详解_天盘缝针的详解使用

安装 CUDA 工具包

CUDA 工具包装好之后,你可以在 cmd 或 中执行 -smi 命令进行验证。

天盘缝针的详解使用_windows7使用方法_windows 7 使用详解

-smi 的输出

安装

现在终于来到本教程的关键了。如果你已经完成了前述步骤,那么这一步会非常简单。

我们通过 Conda 来安装 2.x。

要注意,首先进入我们之前创建的 环境,然后再进行操作。

> conda activate tensorflow

如果你需要 GPU 支持,就运行以下命令:

> conda install -c anaconda tensorflow-gpu

通过 通道安装 的 GPU 支持软件。使用 conda 而非 pip 安装 的一大优势是 conda 的软件包管理系统。使用 conda 安装 时,conda 还会安装所有必需和兼容的依赖包。这个过程是自动的,用户无需通过系统软件包管理器或其它方式安装任何其它软件。

其中也包含 或 所需的版本合适的 CUDA 工具包。因此,使用 conda 能让这个过程变得非常简单。

我们只能在安装了 GPU 的环境中看到所安装的 CUDA 工具包。这既不会影响到全局系统的 CUDA 版本,同时也能满足 和 的不同版本 CUDA 需求。这就是使用虚拟环境的最大好处,它能让不同的虚拟环境完全隔离开。

如果一切顺利,你不会在安装过程中看到任何报错信息。

要验证 和所需的软件包是否成功安装,你可以执行 conda list,这会显示已安装软件包的列表,你应该能在其中找到与 相关的软件包以及 CUDA 工具包。

windows7使用方法_windows 7 使用详解_天盘缝针的详解使用

你也可以打开 来验证是否已安装 。

>>> import tensorflow as tf>>> tf.version'2.1.0'

如果你看到了版本号,那么恭喜你, 已安装成功!任务完成。

在 中验证 的安装情况。

你在 中使用 时可能会看到这样的信息:「 」,但这并不是坏消息。这只是一条日志消息,说明 可以打开这些软件库。

GPU 上的安装情况验证将在下文中介绍。

如果要安装仅使用 CPU 的 ,你需要对安装命令进行简单的修改。

> conda install -c anaconda tensorflow

这将会安装没有 CUDA 工具包和 GPU 支持的 。

安装

安装 的过程与安装 其实没太大差异。conda 让这一切都变得非常简单。

首先,进入我们创建的 torch 环境。

> conda activate torch

如果你想安装支持 CUDA 的 ,使用以下命令:

> conda install pytorch torchvision cudatoolkit -c pytorch

该命令会通过 Conda 的 通道安装兼容 CUDA 的 。

至于仅使用 CPU 的 ,只需从以上命令中移除 即可:

> conda install pytorch torchvision cpuonly -c pytorch

这会安装无 CUDA 支持的 。

和之前一样,你可以使用 conda list 验证安装情况,也可使用以下代码在 上执行验证。

>>> import torch>>> torch.version'1.6.0'

如果返回版本号,则说明已成功安装 。

验证安装情况

有时候,你觉得一切都很顺利,准备开始使用这些工具时却遇到了一些重大错误。如果你正好遇到了这种情况,有可能是机器的问题,也可能是流程出错了,不能一概而论,要具体问题具体分析。

为了帮助你更好地验证安装情况,并确保 和 使用的是指定的硬件,这里分享一些笔记。

你可以在 的 dl-setup-win 文件夹中找到它们。你可以克隆这些笔记然后运行其中的代码。如果返回的信息正确,你就可以放手开发了。

下图是该笔记的代码示例:

windows 7 使用详解_windows7使用方法_天盘缝针的详解使用

注:如果你没有从正确的环境启动 ,就可能会遇到一些错误。例如,如果你想使用 环境,你可以从 base 环境启动 ,然后将核改到 环境,但我在这样操作时遇到过报错。因此,如果你要运行 ,就在 环境里启动 ;如果你要运行 ,就在 torch 环境中启动 。不要从 base 或其它地方启动。

我的个人经验和替代方法

我一直使用这套配置完成一些轻量级的深度学习工作,反正这套本地硬件足够了。现在几周过去了,一切都还不错。但是,在此之前我还尝试过其它一些方法,也出现过一些严重问题。

比如有一次我尝试了这里的方法:,其中涉及在 WSL( for Linux)中启用 CUDA 和英伟达驱动以便使用 GPU 来进行深度学习训练。目前这个功能还在预览阶段,但一旦官方发布,必将为深度学习实践者带来重大影响。这能将让人惊喜的 WSL 与 CUDA/GPU 驱动结合到一起。

不过这是有条件的。要想使用这一功能,你必须参与 项目。当然,根据我的经历,内部预览版往往有很多漏洞。我在使用时遇到过很多问题,包括所有 应用不再响应、GSOD(绿屏死机)错误、未正确启动、驱动故障。我个人不喜欢不稳定的环境,所以选择退出只是时间问题。

你有可能在使用预览版时不会遇到任何问题,只不过我的经历太糟了,所以不推荐使用预览版。

其它替代选择包括完全不使用 ,只使用基于 Linux 的系统,享受更加流畅的体验。只不过 Linux 没有 中那样花哨的 GUI 安装工具。

本文介绍了如何在 系统中安装 、 和 工具,希望对大家有所帮助。

天盘缝针的详解使用_windows7使用方法_windows 7 使用详解

天盘缝针的详解使用_windows7使用方法_windows 7 使用详解

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注