Professional Documents
Culture Documents
最近有几个帖子询问深度学习工作站的搭建方案,我也在主帖里面进
行了一些回复。正好这周休息,有空自己写一个帖子。其实自己也不
是什么大神,只是这两年自己、实验室配置了几台,所以一些经验和
建议和大家分享一下。自己水平有限,很多细节其实也不是完全清楚,
所以也算抛砖引玉,请大神能够指点。
这两三年深度学习和神经网络是非常火的领域,很多很多企业、科研
机构、高校、实验室甚至个人都想进入这个热点。所以除了 intel、nvidia、
厂商也在提供服务和计算平台。这里主要还是针对小规模的桌面级,
或者实验室用的计算平台。需要说明的是,新卡和新 U 要上了,这
可以了。
1、明确应用场所,或者说,谁出钱。企业或研究机构作为生产力工
具,或者说类似于的大型科学设备,那完全是另一种概念,也不在讨
论范围之类。这里的重点还是实验室工作站和个人研究工作站,而且
也不去说多节点配置。
2 实验室工作站:
老板或导师出钱,一般而言可以在预算范围内尽量高配,同时也可以
交给整机供应商配好。一般分为公用计算机、比赛机器。比赛机器一
般单卡,可归为个人研究用;而公用计算机建议 4 卡起配,现在的单
并不方便,所以推荐可以直接由供应商配齐,或者自己买准系统,再
选择 gpu 和硬盘。需要说明几点:
1)个人在实验室里还是喜欢机架式机箱,即使是 4 卡甚至单卡,因
为可以方便地插一些采集卡或板级示波器,可以兼顾硬件调试、图像
采集和图像处理研究,但要注意主板接口,很多板卡是 PCI 的。
2)8 卡或 10 卡主机一定要上机柜,而且单独房间放置,因为噪声很
大。
3)虽然是老板花钱但还是有预算的,我还没有见过哪个实验室上 v100
经是比较豪的实验室了,不知道是否有学校实验室上多块 v100 的。
3 个人研究工作站,意味着自己出钱,那就要好好计划了,所以展开
细说:
也是牙膏厂喜欢缩水的地方(包括主板芯片通道)
。常见的 8700k 是
习不依赖 CPU,只要主频不过低拖后腿即可,且一卡一核;因此主要
道。只是接一个,不组阵列也是可以的。
贵。
上述问题,存储扩展性一般,虽然对个人电脑影响没有那么大。所以
除非是不缺钱,而且有其它用途对 U 性能要求较高,不然单纯就深
度学习而言性价比不高。
非常平衡的板子,双 U 利器,但是要有匹配的机箱才行。
是要弱一些,但是这个可能是目前性价比最高的平台了。如果无法忍
受老 U,不想玩服务器 U 的,或在意保修,那么这个就是最好的选
择了。不过建议等 2900x,对深度学习支持更好。需要注意的是散热
所以建议华硕或技嘉。
3)由于要长时间高负荷工作,机电在工作站配置中是不可忽视的重
点。电源不要省钱,全模组金牌是必须的,因为全模组做到金牌难度
更 大 , 往 往 用 料 更 好 。 单 卡 就 是 650W-750W 电 源 ; 双 卡 就 是
1000-1200W;四卡 1500W 以上。要便宜点的就选长城巨龙,好一些
的无非是海啸、EVGA(超级花方案,但价格和保修更美好)。NVIDIA
可以选 T2,壕一些那当然是贼船 AX 了。
桌面级个人用机箱肯定是塔式,要求是槽数满足要求,散热较好。这
洞。
配,我们目前也在用,如果不喜欢一体水冷也可以上风冷,这里不多
说。
4)硬盘 IO 对于速度影响是比较大的。由于个人工作站一般是不会上
5)内存的考虑顺序是容量优于时序优于频率,这里是有具体研究的。
所以不用追求高频内存,一般根据显存大小配置内存,内存容量是显
128G。其它除了和散热的兼容性外就没什么要注意的了,ECC 也没
有那么重要。c14 更好,觉得贵了普通的即可。
4 下面是几台在用的主机配置,供参考:
1)自己在家用的 itx 深度学习配置(其实就是个游戏主机,机箱和主
机箱 骨伽 qbx(价格美好,长度够用,所以选了) 289
合计 14513
2)实验室在用的双卡个人深度学习工作站,直接从供应商那里买的,
所以不是特别喜欢……
项目 型号 价格
板U 8700K+华硕 prime Z370-F 4000
GPU Dell 1080ti 公版 2 块(自己配选最便宜的 1080ti 即可) 12200
合计 25297
3)实验室在用 4 卡机配置
项目 型号 价格
CPU E5 2680 v4 正显版(CPU 可省钱,捡垃圾看你心有多大) 8400
主板 超微 x10SRA(4 卡最便宜主板) 2300
GPU 技嘉 1080ti 公版 4 块(4 卡机尽量公版,不然可能插不 26000
下,技嘉的小白是目前渠道比较畅通的公版了,价格不
具备参考性)
机械硬盘 无
机电 4U 机架式机箱,长城巨龙 1560W,被动散热 2000
合计 60700
4)自己在用的 4 卡主机
项目 型号 价格
CPU i7 6850K 2558
合计 43240
选择 1900x+x399 套装还能省一些。应该说是目前性价比比较高的了。
5)线程撕裂者性价比配置
项目 型号 价格
板U 1900x+华硕 x399-A(建议等新 U) 5599
GPU EVGA 1080ti black sc 4 块(不考虑前两天 5100 的车价) 22800
散热 利民 银箭 TR4 699
其它风扇 无
合计 38194
再多说一点,也算是给仍在读的学生的一点建议吧:
正如前面说的,这两三年深度学习和神经网络非常火,我自己在招聘
的时候,很多应届生或在职社招的应聘者,尤其是计算机、IT、电子
相关专业领域的,都有自学过一些深度学习的知识,并用某种主流框
架进行训练的经验。这说明了两点:一个是这个方向比较热;另一方
面则是门槛确实不高。这里的门槛包括几个含义,一是研究条件,这
也是大家纷纷进入该领域且中国人在该领域颇有建树的关键,不需要
大型设备也不需要工艺积累(看看半导体…),硬成本低;一个 8 卡
或 10 卡的工作站对于比较好的实验室而言开支也并不太大,个人用
个电脑即可,还可以兼顾打游戏,或者干脆租 AWS。第二则是对于很
多人而言,个人技术基础要求不算高,但这点取决于你个人的定位,
也是配这个工作站时最需要去考虑的问题。现在工具非常发达,且不
成了“敲命令行”,公共资源也比较丰富,导致很多学生甚至没有看
过源码。按照我们自己的话说,这是“电子鸦片”
,开发工具越来越
强悍、高级,对个人的数理基础和技术水平要求随之降低,不仅仅是
在 IT、电子技术,在光、机、热很多领域都是如此。但是在实际工作
中,实现和应用是非常重要的,因此,神网训练后模型的压缩、部署
乃至专用芯片的设计是很多企业真正看重的,也是你个人能够脱颖而
出的关键。因此,非常建议再花一点点钱,配上一块开发板,研究嵌
些对个人天赋有比较高的要求,但事在人为,而且在找工作时接没接
触过相关内容还是比较重要的。