admin管理员组

文章数量:1130349

攒机心得

  • 前言
  • 一、入手GPU
  • 二、主板建议
    • 1.AMD系列
    • 2.Intel系列
    • 3.X99系列
  • 三、电源和机箱建议
  • 四、安装系统以及cuda
  • 五、windows端安装与操作
  • 总结


前言

随着人工智能的不断发展,深度学习这门技术也越来越重要,AI绘图、深度学习的训练都需要GPU计算节点,随着GPU价格的回落,普通人搭建GPU计算集群用来深度学习也成为了致富新道路。本文深度记录了本人一些丐中丐GPU集群攒机经验,给各位友友们分享~


一、入手GPU

GPU种类繁多,无论是矿卡还是新卡,茫茫多的GPU在选择的时候多少让人有点选择困难。但其实不考虑打游戏,单纯用于AI的话,最具性价比的卡按性能、显存和能耗以及个人主管见解来看,排名如下:

  1. Nvidia Telsa P100(250W 16GB)性能较强,不过没有Tensor core,实际运行双精度求解要比别的卡省显存,所以别看显存只有16GB,用起来可能赶上32GB的显存,海鲜市场价大概1300~1600左右,性价比还是可以的;
  2. Nvidia Telsa P40 (250W 24GB) 目前很香的一张卡,大概1/3个3090,没有Tensor core,计算起来大概VGG-19数据集体感5~10分钟左右,没法测那么准但总之就是可以接受,同时24G大显存,满足你大模型的梦想,可以说是穷人跑大模型的首选了。缺点就是你一搜P40几乎都是华为的手机,而且最近海鲜市场的P40不知为何都从南京一个地方发货,价格800元-1000。还有个缺点就是基本上应该都是矿卡;
  3. Nvidia Telsa K40/M40 (250W 24GB) 这个档次的卡主打一个丐帮AI,性能不性能无所谓,省不省电无所谓,爷有的是时间炼丹。没有Tensor core,跑什么都一天起步(虽然有些夸张,但重点就是突出慢),价格五百左右很美丽;
    注意上述三张卡都没有主动散热,所以要么买个3D打印的小风扇,要么自己手动改散热(有可能导致之后卖不出去)。
  4. Nvidia RTX 2080Ti/2080 (250W 11GB) 性能上很强,有Tensor core(20系列以上都有),用来AI绘图绰绰有余,但跑大模型就不行了,价格上2800左右,目前有所上涨,这卡以及后面介绍的卡都有一个前面没有的优势就是可以打游戏,也就是可以当做主力机,所以如果不是有很大的模型要跑,2080的性价比反而更高,而且最近也有了改22G显存的方案(不太推荐,改坏了等于三千打水漂)。缺点就是基本上应该都是矿卡;
  5. Nvidia RTX 3060 12G版 (170W 12GB) 性能上大概一个半的P40(用3090为标杆对比,主要我没实际拿这俩卡跑benchmark比过),显存上12GB足够九成的AI模型运行了(什么你说你模型分分钟20G?回去重新做数据预处理去),当然也不一定,毕竟不是所有的数据都好做的,尤其是一些需要end-to-end的玩法。这卡应该海鲜市场也都是矿卡,大概1500~1600;
  6. Nvidia GTX 1080Ti (250W 10GB) AI老友,众多实验室机房淘汰下来大量1080ti,以及矿山里的大量1080ti都在海鲜市场蓄势待发,和P40一个性能,由于可以打游戏所以价格皮鞭在1200~1800左右,成色这玩意纯属没啥用你看也看不出来,金手指也未必能辨别的那么准确,就当是矿渣,要是1300以下拿下那还行,太贵了的话你就当是打游戏用,那也不赶3060,总之能跑但不太推荐;
  7. Nvidia RTX 2070 (300W 8GB) 打游戏不错,用来AI比较微妙。1000左右的价格让它兼具游戏与AI的性价比,同时20系列以后都有tensor core,不过需要对计算有一定的能力来驾驭8G以内的现存;
  8. Nvidia RTX 3090 (350W 24GB) 性能和显存上无论

攒机心得

  • 前言
  • 一、入手GPU
  • 二、主板建议
    • 1.AMD系列
    • 2.Intel系列
    • 3.X99系列
  • 三、电源和机箱建议
  • 四、安装系统以及cuda
  • 五、windows端安装与操作
  • 总结


前言

随着人工智能的不断发展,深度学习这门技术也越来越重要,AI绘图、深度学习的训练都需要GPU计算节点,随着GPU价格的回落,普通人搭建GPU计算集群用来深度学习也成为了致富新道路。本文深度记录了本人一些丐中丐GPU集群攒机经验,给各位友友们分享~


一、入手GPU

GPU种类繁多,无论是矿卡还是新卡,茫茫多的GPU在选择的时候多少让人有点选择困难。但其实不考虑打游戏,单纯用于AI的话,最具性价比的卡按性能、显存和能耗以及个人主管见解来看,排名如下:

  1. Nvidia Telsa P100(250W 16GB)性能较强,不过没有Tensor core,实际运行双精度求解要比别的卡省显存,所以别看显存只有16GB,用起来可能赶上32GB的显存,海鲜市场价大概1300~1600左右,性价比还是可以的;
  2. Nvidia Telsa P40 (250W 24GB) 目前很香的一张卡,大概1/3个3090,没有Tensor core,计算起来大概VGG-19数据集体感5~10分钟左右,没法测那么准但总之就是可以接受,同时24G大显存,满足你大模型的梦想,可以说是穷人跑大模型的首选了。缺点就是你一搜P40几乎都是华为的手机,而且最近海鲜市场的P40不知为何都从南京一个地方发货,价格800元-1000。还有个缺点就是基本上应该都是矿卡;
  3. Nvidia Telsa K40/M40 (250W 24GB) 这个档次的卡主打一个丐帮AI,性能不性能无所谓,省不省电无所谓,爷有的是时间炼丹。没有Tensor core,跑什么都一天起步(虽然有些夸张,但重点就是突出慢),价格五百左右很美丽;
    注意上述三张卡都没有主动散热,所以要么买个3D打印的小风扇,要么自己手动改散热(有可能导致之后卖不出去)。
  4. Nvidia RTX 2080Ti/2080 (250W 11GB) 性能上很强,有Tensor core(20系列以上都有),用来AI绘图绰绰有余,但跑大模型就不行了,价格上2800左右,目前有所上涨,这卡以及后面介绍的卡都有一个前面没有的优势就是可以打游戏,也就是可以当做主力机,所以如果不是有很大的模型要跑,2080的性价比反而更高,而且最近也有了改22G显存的方案(不太推荐,改坏了等于三千打水漂)。缺点就是基本上应该都是矿卡;
  5. Nvidia RTX 3060 12G版 (170W 12GB) 性能上大概一个半的P40(用3090为标杆对比,主要我没实际拿这俩卡跑benchmark比过),显存上12GB足够九成的AI模型运行了(什么你说你模型分分钟20G?回去重新做数据预处理去),当然也不一定,毕竟不是所有的数据都好做的,尤其是一些需要end-to-end的玩法。这卡应该海鲜市场也都是矿卡,大概1500~1600;
  6. Nvidia GTX 1080Ti (250W 10GB) AI老友,众多实验室机房淘汰下来大量1080ti,以及矿山里的大量1080ti都在海鲜市场蓄势待发,和P40一个性能,由于可以打游戏所以价格皮鞭在1200~1800左右,成色这玩意纯属没啥用你看也看不出来,金手指也未必能辨别的那么准确,就当是矿渣,要是1300以下拿下那还行,太贵了的话你就当是打游戏用,那也不赶3060,总之能跑但不太推荐;
  7. Nvidia RTX 2070 (300W 8GB) 打游戏不错,用来AI比较微妙。1000左右的价格让它兼具游戏与AI的性价比,同时20系列以后都有tensor core,不过需要对计算有一定的能力来驾驭8G以内的现存;
  8. Nvidia RTX 3090 (350W 24GB) 性能和显存上无论

本文标签: 低成本深度AI