一般情况下mysql的启动错误还是很容易排查的,但是今天我们就来说一下不一般的情况。拿到一台服务器,安装完mysql后进行启动,启动错误如下:
有同学会说,哥们儿你是不是buffer pool设置太大了,设置了96G内存。这明显提示无法分配内存嘛。如果真是这样也就不在这里进行分享了,哈哈。
我的服务器内存是128G。如下图:
服务器内存使用情况:
那么问题来了,既然还剩如此多的内存,为什么提示无法分配内存??。各位童鞋怎么看?
1. 首先想到会不会是有几条内存坏了?于是运维的同学进行了检查,给我的反馈是硬件一切正常。
2. 把mysql配置参数又检查了一遍,没有发现什么问题,线上一直就是使用这些参数。
3. 又把文件拷贝到另外一台机器,,另外一台服务器可以正常启动(2台机器硬件配置一致)。
那么如果排除硬件问题,mysql配置问题,那么剩下的就只有操作系统的内核参数配置了。于是把两台服务器进行了对比,最终发现了一个内核参数不一致。
复制代码代码如下:
vm.overcommit_memory
mysql启动正常的服务器改参数的值是0,而mysql启动错误的这台服务器该值是2。
那么问题来了,这个参数到底是什么鬼?竟然会让mysql分配内存失败,最后导致无法启动。经过查询资料知道了vm.overcommit_memory是什么鬼。
vm.overcommit_memory
默认值为:0
从内核文档里得知,该参数有三个值,分别是:
0:当用户空间请求更多的的内存时,内核尝试估算出剩余可用的内存。
1:当设这个参数值为1时,内核允许超量使用内存直到用完为止,主要用于科学计算.
2:当设这个参数值为2时,内核会使用一个决不过量使用内存的算法,即系统整个内存地址空间不能超过swap+50%的RAM值,50%参数的设定是在overcommit_ratio中设定。
vm.overcommit_ratio
默认值为:50
这个参数值只有在vm.overcommit_memory=2的情况下,这个参数才会生效。
那么我们来看一下总的内存地址不能超过多少。其实是可以直接查看的。
[root@yayundeng 3306]# cat /proc/meminfo |grep -i commit
CommitLimit: 70144396 kB
Committed_AS: 135196 kB
[root@yayundeng 3306]#
通过查看可以得知在70G的样子。那么这个是如何计算的呢?这个就是上面提到的一个公式。swap+50%的RAM值,50%参数的设定是在overcommit_ratio中设定。
总虚拟内存 = 可用物理内存 × 百分比 + 交换分区
[root@yayundeng 3306]# cat /proc/meminfo | grep MemTotal
MemTotal: 132096808 kB
[root@yayundeng 3306]#
[root@yayundeng 3306]# free -k
total used free shared buffers cached
Mem: 132096808 1583944 130512864 0 10240 133220
-/+ buffers/cache: 1440484 130656324
Swap: 4095992 0 4095992
[root@yayundeng 3306]# cat /proc/sys/vm/overcommit_ratio
50
[root@yayundeng 3306]#
总虚拟内存=132096808 * 50% + 4095992= 70144396 kB
那么最后的结果就是buffer pool不能超过70144396 kB - 135196 kB=70009200 KB=66G。实际上经过测试,buffer pool只能设置57G。
最后在看看总虚拟内存情况:
CommitLimit:最大可用虚拟内存
Committed_AS:已使用虚拟内存
[root@yayundeng 3306]# cat /proc/meminfo |grep -i commit
CommitLimit: 70144396 kB
Committed_AS: 65539208 kB
那么如果把内核参数vm.overcommit_memory恢复为默认值0,那么将不会受到约束。
复制代码代码如下:
echo 0 >/proc/sys/vm/overcommit_memory
参考资料:
http://serverfault.com/questions/606185/how-does-vm-overcommit-memory-work
http://linuxperf.com/?p=102
总结:
说了这么多,那么为什么要修改内核参数vm.overcommit_memory的值呢?这个是因为这台服务器之前跑过GreenPlum数据库,拿到我手上的时候没有进行重装系统,那么还是建议如果拿到的机器之前跑过其他的业务,那么保险的方法还是重装一下系统,然后再部署自己的业务,不然真的会出现莫名其妙的问题。
解决办法:这个系统错误1067代号的意思就是因为系统找不到文件而错,进程得不到所需文件啦!
我们必须在windows下建立如下文件:my.ini 以让这个服务有这个文件可调嘛。
[my.ini] 内容如下;
[mysqld]
# set basedir to your installation path
basedir=G:/mysql
# set datadir to the location of your data directory
datadir=G:/mysql/data
[WinMySQLAdmin]
Server=G:/mysql/bin/mysqld-nt.exe
这段代码的作用基本上可以看明白吧,主要是写的是数据库mysql地址,以及提供服务所依靠的文件地址。
如果上面的方法不行,可能是系统文件缺省,请重装系统。
解决方法如下:
1,在win7系统上按win+R键,打开运行,输入services.msc,点击确定,如下图所示:
2,进去系统服务之后,在列表中找到Network List Service服务,双击进去,如下图所示:
3,进去Network List Service服务属性界面之后,将启动类型设置为自动,服务进行启动,如下图所示:
4,启动服务之后,如果网络连接图标还一直在转圈,鼠标右键连接图标,打开网络和共享中心,点击更改适配器,进去之后,鼠标右键连接,将之禁用,如下图所示:
5,禁用之后,再将网络连接启用,进行重新识别网络,如下图所示:可以看到已经重新连接上了网络,如果出现黄色感叹号或者红叉,检查网卡驱动和网线接口有没有问题。
欢迎分享,转载请注明来源:夏雨云
评论列表(0条)