用于深度学习的新工作站

DSCF6636.jpg

从菲律宾潜水回来后就一直忙着把新工作站的各个零部件买齐。

去菲律宾之前已经花了大量的时间爬文,参考的文章将附在文末。

其实对于硬件一向了解的不是太多,距离上一次组装Desktop已经有十多年了,而当时也只是停留在知道奔腾4的主频和二级缓存多少,硬盘需要多大,等等,而实际动手组装也是由电脑城的商家一手包办。

家里的空间很有限,所以即便是想更新电脑也一直都以Laptop为主。

原本是想购入Surface Pro 5的(等到头发花白都还没有推出),加之近期想学习一下Deep Learning,所以自己动手组装一台工作站比任何一台便携式电脑要来的更加实用。

直到这次需要对每一个零部件自行决定以及所有的组装工作都由自己完成,才对CPU的PCIE Max Lane、PCIE Bandwidth、M.2 SSD 的种类以及主板上与其他设备兼容性相关的参数有了浅薄的了解。

即便是这样,我自认为也并没有对硬件知识有足够深入的了解。

所以这里我也只是分享一下自己的配置以及选择的愿意作为参考,至于原理的深究则需要另行讨论。

主板Motherboard:技嘉GA-X99-UD5 WIFI 

CPU:Intel Xeon 1620V4  4Core 3.5GHz

显卡GPU:微星MSI GTX 1080 TI 11G GAMING X

内存RAM: Kingston Hyper X DDR4 2400mhz 16Gx2

硬盘SSD:Samsung M.2 PCIe 3.0 x4 960 Evo 500GB

硬盘HDD:Toshiba DT01ACA300 3TB  

电源Power Supply:Corsair RM1000X (1000W金牌电源)

机箱CASE:Thermaltake Level 10 GT

CPU 水冷 Cooler:Thermaltake 一体式水冷 枭龙120 

 

配置信息大致就是这样,上几张图

20170419_202159.jpg 20170420_215853.jpg 20170419_203140_1.jpg 20170420_015211-01.jpeg 20170419_205318-01.jpeg

我对硬件的选择也没有太多哲理性,大致的思路如下:

显卡的选择:

既然整台工作站是为了深度学习而设计的,显卡自然是最最重要也是最贵的一个部件。

NVIDIA GTX 1080 TI vs Titan X? GTX 1080 TI 是最近新出的,当时TITAN XP还没有推出,所以看见很多媒体网站都高呼着1080TI超越TITAN X成为新一代卡皇。TITAN XP的地位自然不用说了,至于TITAN X 和 1080 TI 比到底哪个更强,我已经不需要深究了。显存是大家都追求的一大参数,权衡TITAN X 与 1080 TI的显存以及价钱,加之更多的CUPA 核心数,1080 TI自然是首选。

公版与非公版?这二者的选择则更多属于信仰喜好的问题。有的人比较喜欢公版的涡轮设计以及酷酷的外形,而有的人却喜欢MSI红龙的风扇以及骚气的外表。红龙的风扇有智能温控和静音的特点,能够根据温度决定风扇转不转,而不会像公版那样无论何时都是全速运转。都说公版的涡轮很吵,我没有体验过所以也不知道到底会有多吵。当然,红龙的频率比公版更高,价格也稍高于公版。

主板的选择:

其他很多硬件都很大程度取决于主板,比如用什么CPU,能插多少个显卡,对M.2 SSD的支持程度等等。所以主板的选择是非常重要也是最先要决定的部件。选择这个主板其实也很偶然,就是因为他的4个PCIe x16插槽分离得比较均匀且距离得当,如果插公版的显卡可以并列插4块,当然还有内置WIFI。

GA-X99-UD5 WIFI 与 GA-X99-Ultra Gaming ?我却因为WIFI而选择了前者。实际上后者也有M.2 WIFI的接口,而M.2 WIFI Module是可以另外购买的。

前者较后者更旧一些。后来收到三星 SSD 960 EVO 之后我便有些小小的后悔选择了前者,前者的确也有M.2 SSD PCIe的槽位,可当时并没有留意这个M.2接口的PCIe版本和带宽,实际上它只支持PCIe 2.0 x2 而只有PCIe 3.0 x4才能发挥三星 960 EVO的性能,否则只能达到1/4的读写效能。所以后来不得不买PCIe转M.2的转接卡把SSD插在了本应属于显卡的插槽上。好在我最初也并没有打算上4路显卡,也许日后只会扩展到2路。况且红龙显卡由于散热器过大比公版更加厚,占据了两条PCIe x16插槽,种种因素都决定了我最多只能上2路显卡,而且必须是红龙+公版 1080TI的SLI组合(由于SSD占了一个插槽,已经没有位置再插一块红龙了)。

后者的M.2 恰好是PCIe 3.0 x 4的,另外还有1个USB 3.1 TYPE-C 以及 USB 3.1 TYPE-A (由于我的大部分数据都存在NAS上,平时也并不怎么插USB设备,所以失去了USB3.1的超大带宽其实并没有给我带来很大的影响,反而对比Laptop来说USB3.1的必要性更高)。而UD5则有个Fast Boot 和 自动超频的按钮,按下无需修改BIOS便可快速设定。外形方面我更偏向UD5。名字嘛,Ultra Durable。

CPU的选择:

在选定主板之后,就需要在主板支持的CPU列表中找出合适的CPU。就CPU而言我最关注的参数则是MAX PCIe 3.0 Lanes以及支持的最大内存容量。MAX PCIe 3.0 Lanes决定了PCIe的总带宽,通常决定了显卡能够使用的带宽上限,如果PCIe都插满的话,40 Lanes的必要性就突显了。通常一般的CPU是16 Lanes,而有些i7有28 Lanes,能够提供40 Lanes的i7基本上价格都在4000+,而作为服务器CPU的Intel Xeon E5系列基本上全线都支持40 Lanes,只不过与i7相比Xeon并没有集成GPU。核心的数量与主频的选择,看个人洗好。我并没有选择8核心低主频,而是选择了这款4核8线程主频略高的一款。

内存的选择:

内存想必每个人都知道,当然是越大越好,所以选择了金士顿的骇客神条DDR4 2400 2条16G的。选择HyperX全因外形炫酷而且名字听起来很厉害。如果装满8条内存,总数为128G,需要查看CPU最大支持的内存上限,否则内存再大也是徒劳。

SSD的选择:

系统装在SSD上,数据保存在HDD上想必已经是大多数人采用的标准搭配了。至于SSD品牌的选择,毋庸置疑三星的速度是市面上最快的,960PRO 512G使用MLC颗粒而960EVO 500G是TLC颗粒,价格相差一大截。960 EVO 500G 实测顺序读取3159MB/s,顺序写入1669MB/s

HDD不是重点,就不详述了,Toshiba这款属于爆款,已经是第二块了。

电源的选择:

考虑到扩展至2路显卡,1000W全模组金牌电源应该是有必要的了。不差钱的话可以直接上1600W白金或者钛金电源。

机箱的选择:

机箱的大小是由主板决定的,我的主板是E-ATX,所以基本上只能在FULL TOWER全塔机箱里面选。无论选哪一款机箱,散热都是关键。之前比较青睐Corsair 780T的设计,只可惜机箱实在太长了,位置不够摆。于是又相中了这款已经推出多年的Themaltake Level 10 GT,散热口有可拆洗防尘网设计。加装SATA硬盘无需拆开机箱,特别方便。

 

经过了数小时的折腾(不!是折磨!),硬件安装完毕之后,我一边祈求着别烧主板,一边听见了主板报错的声音。果然,并没有一次点亮。主板报错50,翻看说明书,原因是内存条安装有问题,于是我又试了几次插拔内存条,总算开机了。把Windows和Linux Mint装上,终于可以愉快地开始deep learning之旅啦。

上几张效果图:

DSCF6744.jpg DSCF6659.jpg DSCF6652.jpg DSCF6712.jpg

 

 

参考过的文章:

深度学习攒机小记
帮你踩坑 | 深度学习小钢炮攒机心得
实用指南:如何为你的深度学习任务挑选最合适的 GPU?
机器学习实验机器
深度学习主机攒机小记
我的深度学习工作站攒机过程记录
个人深度学习环境搭建(二):主机配置与组装
打造自己的深度學習計算環境

發表迴響

這個網站採用 Akismet 服務減少垃圾留言。進一步瞭解 Akismet 如何處理網站訪客的留言資料