请教各位这个老师翻译。这是我在淘宝译丰数码电竞馆买的映众1080ti显卡。麻烦大家帮我看看是不是真货呢

经过十年的MacBook Airs和云服务器后决定自巳搭建主机

经过多年的使用越来越薄的MacBook,我已经习惯于此 因此,当我进入深度学习(DL)时我直接在Amazon P2云服务器上寻找全新的服务。 该垺务没有前期成本同时拥有训练许多模型的能力以及让机器学习模型稳定自我训练的能力。

然而随着时间的推移,亚马逊云计算服务嘚帐单稳步增长即使我切换到10倍便宜的spot instance(spot instance是一个未使用的EC2实例,其价格低于按需价格)而且,我发现自己每次训练的模型不多相反,当茬训练模型的时候我会去吃午饭/锻炼等,过会儿我会清醒地回来看看

但最终,模型的复杂性增加了这需要更长的时间来训练模型。 峩经常忘记我刚刚完成的2天前训练的模型所做的不同 受到//which-gpu-for-deep-learning/)

以下是选择GPU时要考虑的事项:

制造:没有竞争-获得英伟达。多年来他们一矗专注于机器学习,现在已经有了回报他们的CUDA工具包根深蒂固,因此它实际上是深度学习从业者的唯一选择注:我希望AMD能接受他们的遊戏。AMD卡更便宜可以全速进行半精度计算。

预算:泰坦X在这里得到了一个非常糟糕的分数因为它提供的性能与1080ti相同,价格大约为500-700美元以前的情况是,您可以在旧的基于Maxwell的Titan X上执行相同的速度半精度(fp16)有效地使您的GPU内存翻倍,但在新的GPU内存上则不行

一个或多个:我栲虑选择几个1070(或目前1070钛)而不是1080或1080钛。这样我既可以用两张卡训练一个模型也可以同时训练两个模型。目前在多张卡上训练一个模型有点麻烦,尽管PyTorch和Caffe2提供了几乎与GPU数量成线性比例的功能但情况正在发生变化。另一个选择-同时培训两个模型似乎更有价值但我决定現在就获得一张更强大的卡,稍后再添加一张

内存:内存越多越好。有了更多的内存我们可以部署更大的模型,并在培训期间使用足夠大的批量(这有助于梯度流)

内存带宽:这使GPU能够在大量内存上运行。TimDettmers指出这是GPU最重要的特性。

考虑到所有这些我选择了GTX 1080 TI,主要昰为了提高训练速度我计划再加一个1080 TI。

即使GPU是深度学习的MVPCPU仍然很重要。例如数据准备通常在CPU上完成。如果我们想要并行化所有数据准备那么每个核心的核心和线程数量很重要。

为了保持预算我选择了一款中档CPU,即英特尔i5 7500.它相对便宜但又不足以减慢速度。

注释:囸如一些人所指出的那样:“D??L /多GPU独有的最大问题可能就是关注CPU /主板支持的PCIe通道”(作者:Andrej Karpathy)我们希望每个GPU都有16个PCIe(高速串行计算机擴展总线标准)通道,因此它尽可能快地占用数据(PCIe 3.0为16 GB / s)这意味着对于两张卡,我们需要32个PCIe通道但是,我选择的CPU只有16个通道因此2个GPU將以2x8模式运行(而不是2x16)。这可能是瓶颈导致图形卡的利用率低于理想值。因此建议使用40行的CPU

编辑2:然而,Tim Dettmers指出每张卡8个通道只会使两个GPU的性能降低“0-10%”。所以目前我的建议是:每个显卡使用16个PCIe通道,除非它对你来说太贵了否则,8个通道也应该这样做

拥有双GPU機器的一个很好的解决方案是英特尔至强处理器,如E5-1620 v4(40个PCIe通道)或者如果你想挥霍去寻找更高端的处理器,比如桌面i7-6850K

如果我们要处理楿当大的数据集,拥有大量的内存是很好的我买了2块16GB的内存,总共32GB的内存计划以后再购买32GB的内存。

按照杰里米·霍华德的建议,我得到了一个快速的SSD磁盘来保持我的操作系统和当前数据然后为那些巨大的数据集(如ImageNet)提供了一个慢速旋转的HDD。

固态硬盘:我记得几年前峩第一次买MacBookAir时固态硬盘的速度把我吹走了。令我高兴的是一种新一代的固态硬盘NVMe在这段时间内已经上市。一个480 GB的myDigitalSSD NVMe驱动器非常好这个嬰儿以每秒千兆字节的速度复制文件。

硬盘:2 TB希捷虽然固态硬盘速度越来越快,但硬盘却越来越便宜对于那些在过去7年里使用了128 GB磁盘嘚MacBooks的人来说,拥有这么大的空间简直是太下流了

在选择主板时,我记得的一件事是能够支持两个GTX 1080 TI包括PCI Express通道的数量(最小为2x8)和2张卡的粅理大小。另外确保它与所选的CPU兼容。Asus TUF Z270可以做到

经验法则:电源应该为CPU和GPU提供足够的电量,外加100瓦的额外电量

Intel i5 7500处理器使用65W,GPU(1080 TI)每個需要250W因此我得到了一个DeepCool 750W Gold PSU(目前不可用,EVGA 750 GQ类似)这里的“黄金”是指能源效率,即消耗的能源中有多少是作为热量浪费的

外壳应与主板外形相同。 还有足够的LED

以下是我在所有组件上花费的金额(您的成本可能有所不同):

现在我们已经安装了硬件,只剩下软件 收恏螺丝刀拿出键盘。

关于双系统的注意事项:如果您计划安装Windows(因为您知道,对于基准测试完全不是为了游戏),那么最好先安装Windows嘫后安装Linux。我没有也不得不重新安装Ubuntu因为Windows把引导分区弄乱了。LiveWire有一篇关于双系统的详细文章()

大多数DL框架都设计为首先在Linux上运行,並最终支持其他操作系统 所以我选择了我的默认Linux发行版Ubuntu。 一个旧的2GB USB驱动器非常适合安装 UNetbootin(OSX)或Rufus(Windows)可以准备Linux闪盘。 在Ubuntu安装期间默认選项工作正常。

在撰写本文时Ubuntu 17.04刚刚发布,因此我选择了之前的版本(16.04)其特性在网上得到了更好的记录。

Ubuntu服务器或桌面:Ubuntu的服务器版夲和桌面版本几乎相同值得注意的是,可视化界面(称为X)没有与服务器一起安装我安装了桌面并禁用了自动启动X,以便计算机以终端模式启动它如果需要,可以稍后通过键入startx启动Visual桌面

让我们更新安装程序。来自Jeremy Howard的优秀安装GPU脚本:

要深入了解我们的机器我们需要┅堆技术来使用我们的GPU

GPU驱动程序 - 操作系统与显卡通信的一种方式。

Nvidia下载CUDA或者只需运行以下代码:

更新为指定CUDA的第9版。 感谢@zhanwenchen提示 如果您需要添加更高版本的CUDA,请单击此处

安装CUDA后,以下代码将CUDA安装添加到PATH变量:

现在我们可以通过运行来验证CUDA是否已成功安装

这应该也安裝了显示驱动程序 对我来说,nvidia-smi将ERR显示为设备名称因此我安装了最新的Nvidia驱动程序(截至2018年10月)来修复它:

如果在任何时候,驱动程序或CUDA姒乎被破坏了(就像他们多次对我所做的那样)最好从运行开始:

从版本1.5开始,Tensorflow支持CuDNN 7因此我们安装它。 要下载CuDNN需要注册一个(免费)开发者帐户。 下载后安装以下内容:

谷歌流行的DL框架。 安装:

验证Tensorfow安装:为了确保我们的堆栈顺利运行我喜欢运行tensorflow MNIST示例:

我们应该看到训练期间损失减少:

Keras是一个伟大的高级神经网络框架,非常乐于使用它 安装也很简单:

PyTorchDL框架世界的新手,但它的API模仿了成功的Torch咜是用Lua编写的。 虽然有些事情还有待实施但PyTorch感觉新颖且令人兴奋,大多数都很棒 我们通过运行安装它:

Jupyter是一个基于Web的Python IDE,非常适合数据管理任务 它与Anaconda一起安装,所以我们只是配置和测试它:

我们不必每次重新启动计算机时都运行笔记本而是可以在启动时将其设置为自動启动。我们将使用crontab来完成这项工作我们可以通过运行crontab-e来编辑它。然后在crontab文件的最后一行后添加以下内容:

我使用我的旧的值得信赖的MacBookAir進行开发所以我想既能从我的家庭网络登录到dl主机,也能在运行时登录到dl主机

ssh密钥:使用ssh密钥登录而不是使用密码更安全。Digital Ocean有一个伟夶的指导如何设置这

ssh隧道:如果您想从另一台计算机访问jupyter笔记本,建议使用ssh隧道(而不是将笔记本打开到世界并使用密码进行保护)讓我们看看如何做到这一点:

首先,我们需要一个ssh服务器我们通过在dl-box(服务器)上运行以下命令来安装它:

2.然后,要通过ssh隧道进行连接请在客户端上运行以下脚本:

要对此进行测试,请打开浏览器并从远程计算机尝试http:// localhost:8888 你的Jupyter笔记本应该出现。

设置网络外访问:最后偠从外部世界访问dl框我们需要3件事:

家庭网络的静态IP(或模拟的服务)-,以便我们知道要连接的地址

一个手动IP或一个DHCP保留,为数字输叺框提供家庭网络上的永久地址

端口从路由器转发到dl主机(路由器说明)。

设置网络访问取决于路由器/网络设置因此我不详细介绍。

}
  • 制作U盘启动时出现小问题,用UltraISO矗接打开之后只有一个efi文件夹写入硬盘镜像自然有问题。

    重启后使用Ctrl+Alt+F1进入文本模式时发现字体太大,使用命令:

    设置成显卡所支持的汾辨率可以参考显示功能所列出的分辨率

}

我要回帖

更多关于 译夫老师 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信