阿里云也就是指的云主机.它可以简单的理解成是一台虚拟服务器.是类似VPS的东西.但与VPS还有所不同.VPS是在一台物理服务器上划分出来一部分的资源搭建而成.一旦母机出现故障.上面所有的VPS将受影响.而云主机是在一组集群服务器上划分出来的多个类似独立主机的部分.集群中的每台机器都有云主机的一个镜像备份.当其中一台机器出现故障时.系统会自动访问其他机器上的备份.所以在安全与稳定性方面.云主机更加强大.
云主机与服务器一样.有独立的IP.内存.带宽等.用户可以根据需要安装各种操作系统以及配置各种网站运行环境.在功能以及使用上与服务器一模一样.同样因为是虚拟的.费用通常比服务器要便宜的多.主要是针对中小规模的应用来使用.
海腾数据杨闯为你解答.若有相关问题需要帮忙的可以来找我.
问题二:阿里云服务器是什么 阿里云云服务器(Elastic pute Service, ECS)是一种处理能力可弹性伸缩的计算服务,其管理方式比物理服务器更简单高效。 阿里云云服务器帮助您快速构建更稳定、安全的应用,降低开发运维的难度和整体IT成本,使您能够更专注于核心业务创新。
问题三:阿里云服务器用的什么cpu 一般是Intel(R) Xeon(R) CPU E5-2430 0 @ 2.20GHz 看型号,有个别是2.0GHz
问题四:新浪云服务器和阿里云服务器有什么区别?谢谢谢谢! 云ECS服务器和轻云服务器都是独享CPU、独享内存、独享带宽、BGP多线接入。但轻云提供了内部控制面板和web软件安装如数据库等,适合初级用户;ECS云服务器适合有一定技术能力的用户,并且配置型号更多
问题五:阿里云的服务器是网通还是电信? 你好.阿里云是多线BGP机房.机房除了电信.网通以外.还有其他线路的接入.目前国内有越来越多的双线机房向多线发展.这样的目的是为了保障全国各地不同线路用户的访问速度.若是追求高性价比的话.推荐你选择中原地区的BGP多线接入.中原占据地理位置优势且带宽充足.在全国各地访问的速度与稳定性会比较均衡.
海腾数据杨闯为你解答.若有云主机相关问题需要帮忙的可以来找我.
问题六:如何使用阿里云服务器 打开浏览器,找到阿里云服务器官网。进入官网后找到云服务器后点击立即购买,进入服务器选择界面后点击立即购买。提示登录自己的淘宝号,进入购买页面。
选择好自己的服务器后点击立即购买,使用支付宝支付(其他方式也行)。(提示:如果选择Windows系统,则要在cpu选择至少1gb)
购买完成后,会收到一个ip地址,用户名,密码。打开电脑开始-->所有程序--->附件-->远程连接。输入ip,用户名,密码即可进入。
问题七:阿里云服务器常见问题有哪些 远程连接服务器For Windows
Windows系统远程桌面无法连接的检查
Mac远程桌面链接ECS Windows2012提示远程桌面连接无法验证您希望连接的计算机的身份
ECS Windows系统多人使用相同账号同时远程登陆
ECS服务器Windows 2008设置远程连接断开后的自动注销时间
ECS Windows 2008 远程连接提示“由于没有远程桌面授权服务器可以提供许可证”的处理办法
ECS服务器Windows 服务器远程登录黑屏
Windows系统修改终端服务导致无法远程
ECS Windows远程桌面访问时出现检测到一个协议出错(代码 0x1104)出错
安卓手机远程桌面连接Windows系统的ECS
Windows 2008远程桌面时出现的界面与上次断开时不同
ECS Windows系统服务所有禁用后重启导致系统无法远程桌面连接
ECS Windows服务器安装安全狗后无法远程连接
ECS Windows2003系统服务器修改远程连接数的办法
ECS Windows服务器远程桌面经常掉线
ECS Windows Server 2012 无法远程且VNC鼠标不能动
windows2003远程登陆报错: 远程计算机上的Windows登录软件被不兼容的软件Ginastub.dll取代
ECS Windows远程桌面分辨率设置
远程桌面复制黏贴无法使用
ECS Windows 2003系统IPSEC服务异常导致无法远程
ECS Windows系统远程连接提示终端服务器超出了最大允许连接
ECS Windows Server如何购买微软的Remote Destop Services服务
Windows服务器重启后自检,提示大量注册表在检测中
ECS windows系统开始后一直是蓝色背景屏幕(非蓝屏crash)的解决方案
ECS Windows服务器VPN连接报错:出错628 解决办法
Windows 2008系统远程协助无法勾选
ECS Windows远程桌面中切换会话
Windows操作系统取消登录显示输入ctrl+alt+del的办法
ECS Windows服务器桌面分辨率过高导致VNC花屏处理办法
ECS Windows2003远程登陆时提示您已经被拒绝登录到终端服务器的解决办法
ECS服务器使用本地软件进行远程连接办法
ECS云服务器远程报错secured by secureRDP
ECS Windows远程桌面连接被拒绝,因为没有授权此用户帐户进行远程登录问题排查办法
ECS Win2008远程时提示要登录到此远程计算机,您必须被授予允许通过终端登录登录的权限的解决办法
Windows服务器无法远程登录提示“试图登录 但是网络登陆服务没有启动”
ECS Windows系统远程链接超过最大连接数
ECS Windows无法远程登录同时外网全部端口不通
Windows 2008远程连接提示“本地会话管理器 服务未能登录”的处理办法
ECS Windows2008如何实现一个账号只允许一个客户端登录
ECS Windows2008 2012如何设置同时只允许一个用户远程连接服务器
windows 无法远程
ECS Windows远程连接失败提示协议出错会话中断
ECS控制台无法连接管理终端
ECS Windows 2012修改远程桌面端口
ECS Windows 2......>>
问题八:阿里云到底是什么啊? 阿里巴巴做的云计算产品,什么叫云计算你可以百度一下,国内类似的云主机产品还有腾讯云,盛大云,太平洋臻云,西部云,美橙云等等。
云主机是基于云计算平台的一种虚拟的主机服务器产品,特点是资源分配配置灵活,安全性能强。与之前的VPS和独立服务器产品相比有一定的优势。
你也可以把云主机理解为一台基于云平台的服务器或主机,通过远程连接登陆后,你会发现他就是一台服务器电脑,你在本地电脑上能做的事情,在这台云主机服务器上,你都可以做到。
如果你要使用JSP项目,那么你要自己在云主机服务器上安装相应的应用脚本和数据库等搭建你自己需要的环境。如果不会可在网上查找JSP环境搭建教程
问题九:如何选择阿里云云服务器ECS操作系统 方法/步骤
首先,我们要清楚的便是每个系统之间的差别,以及在阿里云上的差别:
1. Windows
1.1) 系统内含正版激活。
1.2) 适合于运行Windows下开发的程序,如等。
1.3) 支持SQL Server等数据库(需自行安装)。
1.4) 可以使用远程桌面方式登录进行管理。
注:512内存不支持选择Windows系统,1G以上内存才能很好支持该系统。
2. Linux
2.1.1) 最流行的服务器端操作系统,强大的安全性和稳定性。
2.1.2) 免费且开源,轻松建立和编译源代码。
2.1.3) 通过SSH方式远程访问您的云服务器。
2.1.4) 一般用于高性能web等服务器应用,支持常见的PHP/Python等编程语言,支持MySQL等数据库(需自行安装)。
2.2 CentOS (推荐)请使用yum方式在线安装软件。
2.3 Ubuntu请使用aptitude方式在线安装软件。
2.4 Debian请使用apt-get方式在线安装软件。
2.5 Aliyun Linux(兼容 Red Hat)请使用yum方式在线安装软件,yum源需要自行购买redhat的商业支持。
操作系统更换规则:
1.更换操作系统
更换系统之前请先停止云服务器,云服务器更换操作系统会直接重置系统盘【IP不变】,系统盘数据将会丢失!
请您注意:
1.1. 更换操作系统会使云服务器的系统盘更换为新的镜像,原有系统盘的数据都会丢失。
1.2. 云服务器数据盘的数据不会受到影响。
1.3. 建议您将系统盘的个人数据备份到数据盘中,或采用其他方式进行备份。
1.4. 因您没有备份系统盘相关个人数据而造成的数据丢失,阿里云不承担责任。
1.5. 内存为512M云服务器不支持更换Windows操作系统。
2. CPU/内存与操作系统的选择
2.1)如需选择/变更4G以上内存请您选择64位操作系统(32位操作系统存在寻址限制)。
2.2) 如您选择32位操作系统,4G以上内存页面暂不展示,只有云服务器更换为64位操作系统才可展示。
2.3)Windows 32位操作系统支持最高CPU为4核。
2.4)配置:[CPU:1核内存:512M] 的云服务器不支持选择/更换Windows操作系统。
Windows篇
阿里云提供了6种window系统,涵盖了Server 2003 sp2以及Server 2008 R2这两大类操作系统。
其中又分为了32位和64位
(1)如何选择32位还是64位
32位系统相比64位系统,最主要的限制体现在内存的大小上。因为32位本身的限制,其最大只可支持到4GB内存,如果您的网站要使用高于4GB的内存或者以后有扩充内存寻到4GB以上的打算,请使用64位操作系统。
(2)选择2003还是选择2008
对于windows来说,我个人建议是选择版本越高的越好。相对来说新版本漏洞相对来说更少,而且IIS 7.5相对于IIS6提供了更多的功能以及更方便的控制台。但是考虑到大家的机器配置不同,在此给出一下几种选择:
A:配置低于双核 2GB内存:选择server2003 不装数据库配置双核4GB: server 2003 mssql 或者 server 2008 R2 不带数据库
B:配置高于双核 8GB:serever 2008 R2 mssql 建议如果大家要在云服务器上跑数据库,尽量选择大内存配置,或者降低配置去选用RDS
(3)中英文、安全加固版如何选择
这个就依据大家各自的喜好来了,在此不多说了至于W......>>
问题十:在网上经常看到什么阿里云腾讯云服务器,是什么意思?有什么作用?求详细解释。百度百科有点懵逼 阿里云,腾讯云是两个品牌的名字。云服务器主要用来存放站点数据,搭建网站使用!
搭建服务器,首先需要解决动态IP的问题,本地网络每次联网IP地址都不一样,可以选择花生壳或者购买一条IP!然后就是配置服务器环境,如果你需要的是php+mysql的环境可以选择护卫神这个比较好用安全!如果想用Linux系统,可以安装一个wdcp面板,该面板是免费的管理也很方便! 如果有疑问请继续追问!
稳网周明为你解答,希望能够帮到你!
一、背景和现象
初创公司,架构lanmp,web前端和后端分开服务器,业务驱动主要是nginx和apache,nginx主要是处理静态文件和反向代理,前后端、搜索引擎、缓存、队列等附加的服务都是用docker容器部署。因为比较初级,上传文件和采集文件都是直接写在硬盘上,涉及到的目录共享,就在其中一台服务器存储并且nfs共享。我们暂且分为ECS1(apache1)、ECS2(apache2)、ECS3(nginx)。某天网站业务中断,但是没有报错。一直在等待响应,默认响应超时是一分钟,所以很基础高可用没有起到作用。中断10分钟左右,重启服务,提示“open too many files”,但是lsof统计没几个。因为初级处理不了,所以直接重启服务器,一段时间后一切恢复正常,可是第二天又来一次这种情况。
二、第一次出现后的排查思路
本来第一次发现这种问题的时候就要追查原因了,看了一下zabbix监控图像其中断了十分钟,包括网络、内存、CPU、硬盘、IO等监控数据。首先想到的是网络问题,结论是zabbix-servert获取不到了zabbix-agent采集的数据,估计就是网络不通了。
但是,这个结论站不住脚,因为我本身通过ssh登录服务器,并且命令输入无卡顿,不至于头文件都传不过来。后来一看阿里云的云监控,上面有数据,似乎也可以佐证网络这个说法,因为云监控是阿里云内部的监控,可以内网获取到监控数据。直到看CPU的使用率这项,发现有一段时间的CPU使用率100%。并且我重启的时候CPU恢复正常,不能说网络一定没问题,但系统肯定有问题。也可以解释因为CPU使用已经是100%,zabbix-agent和根本不能正常运行,所以没有监控数据。因为这个公司全部都是云服务器,没有使用IDC所以我们也没有安装smokeping来监控,接着我们就不把重心在网络上了。
目前掌握的信息就是:在毫无征兆的情况下,CPU暴涨到100%,重启之前一直保留,重启之后恢复原样。匆忙之中又看了一下系统各日志,因为太匆忙,没有总结,没有找到什么有价值的东西。现在有下面几种猜想:第一,程序的bug或者部署不当,触发之后耗尽资源。第二、docker容器的bug。第三、网络攻击。第四、病毒入侵。第五、阿里云方系统不稳定。
小总结了一下,现在问题还没有找出来。下次还有这个问题的可能,所以先尽量防范,但是又不能重启一刀切。所以在zabbix上面设置了自动化,当检测到ECS1获取不到数据的时候马上操作ECS3标记后端为ECS1的apache为down。保留异常现场。(请求停止的时候,CPU100%还在)
三、现场排查
1、相应的排查计划(想到这些信息需要获取的,实际上没有严格按照这样的步骤)
1)用htop和top命令监控CPU、内存使用大的进程。先看看哪个进程消耗资源较多,用户态、内核态、内存、IO……同时sar -b查io的 历史 定时抽样。
2)统计tcp连接数,看看有没有DDOS攻击。netstat -anp |grep tcp |wc -l 。用iftop-i eth1看看通讯。同时用tail -n 1200 /var/log/messages查看内核日志。
3)用pstree查看打开进程,ps aux|wc-l看看有没有特别多的进程。虽然zabbix监控上说没有,但是我们要检查一下看看有没有异常的进程名字。
4)查看全部容器的资源使用docker stats $(docker ps -a -q),看看能不能从容器上排查。
5)有了“too many open files”的启发,计算打开文件数目lsof|wc -l,根据进程看看ll /proc/PID/fd文件描述符有没有可疑的打开文件、文件描述符。
6)关于用lsof打开文件数找到的线索,排序打开文件找出进程号 lsof -n|awk '{print $2}'|sort|uniq -c|sort -nr|more
7)关于用lsof打开文件数找到的线索,用lsof -p PID查看进程打开的句柄。直接查看打开的文件。
8)启动容器的时候又总是“open too many files"。那就是打开文件数的问题,因为CPU的使用率是CPU的使用时间和空闲时间比,有可能因为打开文件数阻塞而导致CPU都在等待。针对连接数的问题,大不了最后一步试试echo 6553500 >/proc/sys/fs/file-max 测试打开文件对CPU的影响。
9)玩意测出来了消耗CPU的进程,可以使用strace最终程序。用户态的函数调用跟踪用「ltrace」,所以这里我们应该用「strace」-p PID
10)从程序里面看到调用系统底层的函数可以跟踪。跟踪操作 strace -T -e * -p PID,主要看看代码调用的函数有没有问题。
2、现场排查
第二天同样时间,ECS果然暴涨了CPU。这是时候zabbix的工作如希望进行保留了一台故障的ECS1给我。
1)用htop看到资源使用最大是,搜索引擎下我写的一个判断脚本xunsearch.sh。脚本里面很简单,判断索引和搜索服务缺一个就全部重启。就当是我的容器有问题我直接关掉搜索引擎容器。httpd顶上,我又关掉apache容器。rabbitmq相关进程又顶上。这时候我没心情周旋了,肯定不也是这个原因。sar -b查看的 历史 io也没有异常。
2)统计tcp连接,几百。先不用着重考虑攻击了。用tail -n 1200 /var/log/messages查看内核日志,是TCP TIME WAIT的错误。可以理解为CPU使用100%,程序无响应外面的tcp请求超时。这是结果,还是没有找到根本原因。
接着往下看系统内核日志,发现了和“open too many files”呼应的错误,“file-max limit 65535 reached”意思是,已到达了文件限制瓶颈。这里保持怀疑,继续收集其他信息。
3)查看进程数量,数量几百。列出来也看到都是熟悉的进程,可以先排除异常进程。
4)监控容器的资源使用,里面很不稳定,首先是xunsearch容器使用80%的CPU,关掉xunsearch,又变成了其他容器使用CPU最高。很大程度上可以排查容器的问题和执行程序的问题。
5)查看了最大连接数cat /proc/sys/fs/file-max是65535但是用lsof查到的连接数是10000多,完全没有达到连接数。
6)各项参数都正常,现在聚焦在打开的文件数这个问题上面。也可以用另外同一种方式查看一下内核统计文件 /proc/sys/fs/file-nr,比较一下差异,看看能不能找出问题。cat了一下,打开文件数是66080,果然超了!内核日志就以这个为标准。
但是看lsof怎么统计不出来,ll /proc/PID/fd也没几个。这个问题放在后面,先按照步骤echo 6553500 >/proc/sys/fs/file-max给连接数提高到100倍,CPU果然降了下来。原因确认了,但是必须找到根源,为什么忽然有这么大的打开文件数。关掉全部docker容器和docker引擎,打开文件数是少了一点,但是仍然在65535差不多。我就先排除一下业务的影响,把ECS3的nginx直接指向视频ECS2的apache,就等同于在ECS2上实现了ECS1的场景。查看一下ECS2的句柄数,才4000多,排除了业务相关应用对服务器的影响。那就能下个小结论,ECS1被神秘程序打开了6万多句柄数,打开业务就多了2000多的句柄数,然后就崩溃了。不过这个现象有点奇怪,ECS2和ECS1在一样的机房一样的配置一样的网络环境,一样的操作系统,一样的服务,一样的容器,为什么一个有问题,一个没问题呢?不同的只是有一台是共享nfs。难道是静态文件共享了,其他人读了,也算是本服务器打开的?
7)现在程序找不到,没法继续lsof -p了。排查之前的猜想。带着排查得到对的结论往下想。
程序的bug和部署不当,那是不可能的,因为主要问题来自于打开句柄数,当部署到ECS2那里,一切正常。docker容器的bug,那也不可能的,每个都是我亲自写脚本,亲自编译,亲自构建的,关键是我关掉了docker容器和引擎都没有很大改善。网络攻击也排除,因为网络连接数没几个,流量也不变。那就只剩下病毒入侵也不是,没有异常进程。考虑到ECS的稳定性问题了。这方面就协助阿里云工程师去排查。
8)阿里云工程师用的排查手段和我差不多,最终也是没能看到什么。也只是给了我一些治标不治本的建议。后来上升到专家排查,专家直接在阿里云后端抓取了coredump文件分析打开的文件是图片,程序是nfsd。
好像印证了我刚才后面的猜想,应该就是ECS1使用了nfs共享其他服务器打开了然后算在ECS1头上。那问题又来了,我们的业务已经到达了可以影响服务器的程度吗?
9)既然问题解决到这一步,先不管程序有没有关闭打开的文件和nfs的配置。我们架构上面的图片应该是归nginx读取,难道是linux的内存机制让它缓存了。带着缓存的问题,首先去ECS3上释放内存echo 3 >/proc/sys/vm/drop_caches,释放之后,发现没什么改善,有点失落。总是觉得还有一台后端是PHP主导,但是逻辑上是写入,没有打开文件之说。后来从程序员中了解到,PHP也有打开图片。我猛然去ECS2释放一下内存,果然,句柄数降下来。(这里大家一定有个疑问,为什么我直接想到内存缓存而不是目前打开的文件呢。其一,这是生产环境,web前端只有一个,不能乱来停服务。其二,第一次遇到问题的时候,重启之后没有问题,过了一天之后积累到一定的程度才爆发,这里已经引导了我的思路是积累的问题,那就是缓存不断积累了)
10)因为ECS2的调用ECS1的nfs共享文件,所以lsof也有读不到那么多句柄数的理由。如果说是nfs的服务本身就有缓存,导致问题的话,我查看了配置文件,还是默认值允许缓存,30S过期,根本不会因为nfs的缓存造成打开文件过多。如果我们的后端程序打开之后没好好处理的话,那倒有可能。然后尝试排除:我改了ECS3的配置,使程序只读ECS1后端,从ECS1上面却看不到有什么异常表现,说明PHP程序已经好好处理了打开的文件。也不是docker挂载了nfs的共享的问题,因为nginx也有挂载。排查到这里也很大程度上解决问题,而且缓存了nfs的全部共享文件,句柄并没有增加,也算合理,所以就增加了打开文件数的限制。
11)现在排查的结果是跟后端和nfs共享有关。就是说,后端挂载了nfs的网络共享,被程序读取。而程序释放之后,在正常背景的硬盘文件是没有缓存的。但是在nfs挂载的环境下,缓存并没有得到释放。
12)总结:很多问题的排查和我们的猜想结果一样,但是有些例外的情况。比如这次我想到的原因都一一排除,但是问题也是在一步步排查中,逐步被发现的。
最厉害的服务器是阿里云:阿里云依托于阿里巴巴集团,通过对其丰富的网络资源进行整合,拥有自己的数据中心,是国内云服务器的大佬,品牌名气较大。阿里云的国际输出速度快。目前,有北京、青岛、杭州、香港机房可选,多线BGP接入;欢迎分享,转载请注明来源:夏雨云
评论列表(0条)