首先确认您的模型是否需要CPU的计算力
深度学习训练,4GPU主流配置10核CPU,8GPU建议配置12核以上
内存:
显存的总和再加32G基本能满足需求(如4卡3090显存总和为96G,加32G等于128G)
硬盘:
机械盘不能满足大部分模型数据读取,推荐480G SSD做为系统盘,热数据用SSD存储,冷数据用机械盘
GPU:
Geforce系列可用于深度学习,Tesla系列 深度学习 高性能计算,Quadro系列绘图渲染
选择GPU服务器的配置不同、性能不同,价格自然不一样,你可以去官网了解一下
看cpu用CPU-Z看GPU用GPU-Z硬盘用HD-tune,测试网速建议用360安全卫士的,比较准确。看电脑用了多久就下个鲁大师,里面有个硬件健康可以看电脑的硬件是什么厂家的以及用了多长时间的。至与要看你的电脑是什么系统,点桌面那个我的电脑,用鼠标右健打开点击属性,在常规那里就可以看到你的CPU是什么?频率是多少?内存可以识别多少?还有你的电脑是什么系统?哈哈。当然一目了然。希望我说的这些可以帮到你。大致结果类似下图:
Mem行(单位均为M):
(-/+ buffers/cache)行:
Swap行指交换分区。
实际上不要看free少就觉得内存不足了,buffers和cached都是可以在使用内存时拿来用的,应该以(-/+ buffers/cache)行的free和used来看。只要没发现swap的使用,就不用太担心,如果swap用了很多,那就要考虑增加物理内存了。
大致结果类似下图:
上方文字部分的红框为总的CPU占用百分率,下方的表格是每个进程的CPU占用率,在表格第一行可以看到红框中占用率超过了150%,这是因为服务器是多核CPU,而该进程使用了多核。
大致结果类似下图:
表格中会显示显卡的一些信息,第一行是版本信息,第二行是标题栏,第三行就是具体的显卡信息了,如果有多个显卡,会有多行,每一行的信息值对应标题栏对应位置的信息。
需要注意的一点是显存占用率和GPU占用率是两个不一样的东西,类似于内存和CPU,两个指标的占用率不一定是互相对应的。
在下面就是每个进程使用的GPU情况了。
大致结果如下图:
表格中每一行代表一个文件系统,各列意义如下:
要查看具体某个文件或者文件夹的大小的话,可以使用下面的命令:
du命令可以查看文件或文件夹的磁盘使用空间,而-h参数的意思是使用GB、MB等易读的格式。如果不带--max-depth参数,那么将循环列出文件夹下所有文件和文件夹占用的空间,带此参数,则是指定深入目录的层数。
如果要看文件夹下所有文件的大小,可以使用*:
查看作者首页
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)