所以就需要使用 N 台服务器,组成一个群集,共同处理庞大的数据,这样就能极大提升效率了。
Hadoop其实就是一个分布式的文件系统,数据会分布到 N 台服务器中,一旦需要处理数据,则 N 台服务器共同进行处理,再把各个中间结果汇总成最后的结果。
当然,这需要特别的算法,不能再使用传统的算法了,这就要使用 MapReduce 框架了。
我们万能的淘宝就是使用了 hadoop 的,你想想上年双十一那 一千亿交易额,其中累积起来的数据可是很惊人的。
至少5台。为了满足场景5000的并发请求,至少有5台服务器,没有强制是五台,服务器的数量取决于你有多少服务器能满足压测需求。
服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)