1CPU金牌6326 16核心32线程 基频2.9GHZ 加速频率3.5GHZ TDP: 185W2
2内存512G(32GB*32) DDR4 3200MHZ1
4准系统超微420GP-TNR 4U机架式准系统, 带2200W冗余2+2电源平台最大支持lO个GPU
32个DIMM插槽;母板超级X12DPG-OA6处理器中央处理器双插槽 P+ (LGA-4189)第三代英特尔 至强 可扩展处理器支持CPU TDP 270W核心高达40C/80T;高达 60MB 的缓存图形处理器支持的GPUHGX A100 8-GPU 40GB/80GB SXM4 多 GPU 1
5SSD三星PM9A1 1TB M.2接口 NVMe协议 四通道 PCIe4.0 固态硬盘1
6SATA希捷(Seagate)银河系列V6 6TB ST6000NM021A 7200RPM 256MB SATA3企业级硬盘1
7GPU卡英伟达RTX 4090公版4
主要是看运行什么软件和数据量,训练数值大小,这里要强调一下,数值大小和数据量是不一样的。
深度学习服务器的核心部件还是CPU、硬盘、内存、GPU,特别是很多深度学习依靠GPU的大规模数据处理能力,这就要强调CPU的计算能力和数量,同时不同的数据对GPU的显存要求也不一样。
当下大部分都在用RTX3090做深度学习,最新RTX4090已经上市,单精度计算能力是RTX3090的2倍,这两个GPU都是24G显存;像A100强调双精度计算能力,显存有40G和80G两个版本,而A6000单精度计算能和RTX3090差不多,显存是48G,可以参考选择。
当然,最重要的还是口袋里的银子,A6000市场价大概是RTX的2倍还要多,A100最近更是要上十万了,估计也快买不到了,价高缺货;RTX3090/4090的价位低,性价比高,这也是为什么大部分人都选择它们做深度学习了,这是市场的选择。
选择带GPU的镜像后更新源,安装必要依赖
配置中文环境
sudo vim /etc/environment
添加下面两行
接着
安装pytorch
安装vision
配置zsh
个人配置
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)