MySQL下PID文件丢失的相关错误的解决方法

今天同事A找到我,说是Mysql server X的负载很高,查询很慢。他自己捣鼓了一阵未果后,我们一起看了下。

[root@redhat var]# uname -a
Linux xxx 2.6.18-128.el5 #1 SMP Wed Dec 17 11:41:38 EST 2008 x86_64 x86_64 x86_64 GNU/Linux

[root@redhat var]# mysql -u root -p -e “select version();”
+------------+
| version() |
+------------+
| 5.1.32-log |
+------------+

同事A的操作:
A一看mysql server有问题第一反应是重启mysql server,囧!!o(╯□╰)
但是又使用了错误的命令

[root@redhat var]# /var/lib/mysql/libexec/mysqld restart ----操作①
100708 14:43:53 [ERROR] Fatal error: Please read "Security" section of the manual to find out how to run mysqld as root!
100708 14:43:53 [ERROR] Aborting
100708 14:43:53 [Note] /var/lib/mysql/libexec/mysqld: Shutdown complete

发现问题后,他又想起来应该是用下面的命令重启

[root@redhat var]# service mysql restart ----操作②
MySQL manager or server PID file could not be found! [FAILED]
Starting MySQL......

CTRL+C取消

这时候

[root@redhat var]# ps aux | grep mysql

可以看到,系统又启动了一个Mysql进程,但是过一会后,会自动消失,这时候看日志可以发现以下错误:

100708 15:26:52 [ERROR] Can't start server: Bind on TCP/IP port: Address already in use
100708 15:26:52 [ERROR] Do you already have another mysqld server running on port: 30017 ?
100708 15:26:52 [ERROR] Aborting

然后后面我们一起看。
首先我用client工具连接,发现mysql正常。web应用连接数据库也正常只是查询很慢。
其次我在命令下面,连接:

[root@redhat var]# mysql -u root -p

提示:

Enter password:
ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2)

这时候同事A提醒我,可以重启服务没关系。囧,o(╯□╰)o,他在建议我重启解决问题。
好吧,如他所愿。于是我先:

[root@redhat var]# service mysql stop
MySQL is running but PID file could not be found

然后去mysql data dir下面查看,果然没有pid file。
这时候我的第一反应是配置文件不对,导致不能正常停止和重启。
由于server是好的,因此我没有急着去比较以前备份的/etc/my.cnf.bak和/etc/my.cnf。
我们先查找负载高的原因。因为命令行下无法进入mysql,在client下使用

代码如下:

show processlist;

可以看到里面有很多locked的查询,其中等待时间最久的一个是一个select查询,显示正在sending data,然后其余都是locked。
猜想是sending data的线程占用了“所有的分配给mysql的资源”,导致后来的线程全部挂起,由于“查询(线程)是依次执行的”,后面locked的线程一直在等待前面sending data的线程结束。(这一段是猜想的…)
sending data的这个线程U是一个select 查询,这个select对6张表进行了连接(公司的一个实习生提交的一个查询),其中有两张表的数据量在10w左右,另外有张data表数据量在 1000w左右,另外还有sum(distinct ) ,group by,order by… 可以想象下…不知道要到何年何月这个查询才能执行完。
这个sending data的慢查询的processid为799,当机立断运行

代码如下:

kill 799

然后再运行

代码如下:

show processlist;

可以看到前面locked的线程在一个个依次执行,后面还有好多个跟线程U类似的select线程,全部kill掉后,被堵塞的别的正常的几个Update,select,insert操作很快就执行完了。
而后,web应用恢复正常,速度变快。
返回linux命令行,使用

[root@redhat var]# top
<shift+m 按内存使用排序>
<1 显示cpu使用情况>

这时候可以发现server负载恢复正常。

下面解决无法正常关闭重启的情况。
也就是因为前面同事的误操作引起的

ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2)
和MySQL manager or server PID file could not be found! [FAILED]

的错误。
我前面不是怀疑是配置文件里面有什么无法识别的参数选项么。
通过

[root@redhat var]# diff /etc/my.cnf /etc/my.cnf.bak

发现,配置文件没有问题。

#我的server的hostname,mysql pid文件默认名字为hostname.pid,如果没有在/etc/my.cnf里面指定特定和pid filename和pid file path的话,这个文件是跟mysql数据在一起的。

[root@redhat var]# diff /etc/my.cnf /etc/my.cnf.bak

这时候通过

#切换到mysql data dir(mysql的数据文件目录下)
#你们的mysql data dir或许跟我的不一样哦,我的是/var/lib/mysql/var/
[root@redhat var]# cd /var/lib/mysql/var/

获取mysql用户运行的mysql进程的 pid,然后导入到hostname.pid文件里面

[root@redhat var]# echo `ps aux | grep mysql | grep "user=mysql" | grep -v "grep" | awk '{print $2}'`>> redhat.pid
#注意这里的redhat.pid跟hostname相关,这里是我的hostname.pid

将文件的属主和属主组改为mysql:mysql

[root@redhat var]# chown mysql:mysql redhat.pid

然后运行

[root@redhat var]# mysql -u root -p

还是会提示:

Enter password:
ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2)
[root@redhat var]# ls /tmp | grep sock

果然没有mysql.sock这个文件

但是这时候运行

[root@redhat var]# service mysql status

显示

MySQL running (10949) [ OK ]

恩,pid file文件恢复正常,然后运行

[root@redhat var]# service mysql restart
Shutting down MySQL. [ OK ]
Starting MySQL. [ OK ]

这时候再运行

[root@redhat var]# ls /tmp | grep sock

可以发现重启后,/tmp下有了mysql.sock这个文件。

大家可以搜索下mysql.sock的用途以及使用产生等等。

同事A的 操作① 导致pid 文件丢失, 操作② 导致mysql.sock文件丢失,大家感兴趣可以去vi mysqld脚本和server mysql脚本,然后导致service mysql status/stop/start/restart运行异常,导致命令行下mysql -u root -p登录mysql异常。

That's all.

(0)

相关推荐

  • Starting MySQL.Manager of pid-file quit without updating file.[FAILED]的解决方法

    因为硬盘满了,mysql启动不起来了. 登录上去看了一下,发现原因. 删除mysql的日志文件,重启mysql发现错误:Starting MySQL.Manager of pid-file quit without updating file.[FAILED] 网上有不少这个原因的解释,但是都不是我想说的.我要说的原因其实很白痴:data/mysql-bin.index没有删除,data/mysql-bin.index是存放日志文件索引的文件,只删除了日志文件而没有对日志的索引文件做处理显然是不

  • MySQL提示:The server quit without updating PID file问题的解决办法

    用df命令查了下,果然磁盘满了,因为当时分区采用系统默认,不知道为什么不能自动扩容!以后在处理这个问题!如图所示: 复制代码 代码如下: [root@snsgou ~]# df文件系统                 1K-块      已用      可用 已用% 挂载点/dev/mapper/vg_snsgou-lv_root51606140  47734848   1249852  100%      /tmpfs                  1953396        88  

  • mysql:Can't start server: can't create PID file: No space left on device

    解决案例一: 今天公司服务器上所有的网站都出现问题,有的打开没有数据,有的直接是空白. 我的第一反应就是数据库挂了.打开远程,进了系统,service mysqld stop 失败.service mysqld start等了好大一会,提示Timeout error occurred trying to start MySQL Daemon 一开始以为是mysql用户问题,查询系统用户完全没有问题. 打开log日志一看,问题出现了Can't start server: can't create

  • linux mysql 报错:MYSQL:The server quit without updating PID file

    1.可能是/usr/local/mysql/data/rekfan.pid文件没有写的权限解决方法 :给予权限,执行 "chown -R mysql:mysql /var/data" "chmod -R 755 /usr/local/mysql/data"  然后重新启动mysqld! 2.可能进程里已经存在mysql进程解决方法:用命令"ps -ef|grep mysqld"查看是否有mysqld进程,如果有使用"kill -9  进

  • Mysql挂掉后无法重启报pid文件丢失的解决方法

    阿里云单核2G的配置挂着两个企业网站,访问量一般.最近每天几乎都会出现网站打不开显示数据库链接失败的问题. 多方寻求原因发现,mysql的pid文件缺失,并无法重启自建,后来也看了其他帖子说关闭日志什么的未果,查看系统日志发现,是因为内存满了导致mysql进程被杀,然后就一直挂起状态. Sep 25 11:33:48 iZ28jcqqr7lZ kernel: Out of memory: Kill process 23201 (mysqld) score 53 or sacrifice chil

  • MySQL下PID文件丢失的相关错误的解决方法

    今天同事A找到我,说是Mysql server X的负载很高,查询很慢.他自己捣鼓了一阵未果后,我们一起看了下. [root@redhat var]# uname -a Linux xxx 2.6.18-128.el5 #1 SMP Wed Dec 17 11:41:38 EST 2008 x86_64 x86_64 x86_64 GNU/Linux [root@redhat var]# mysql -u root -p -e "select version();" +--------

  • Android开发中R.java文件丢失或无法更新的解决方法

    本文分析了Android开发中R.java文件丢失或无法更新的解决方法.分享给大家供大家参考,具体如下: 首先确定你的SDK是新的. 其次接下来检查你的.xml文件,文件名不能大写. 如果xml文件太多 ,那么clean一下你的项目,这时候注意看Console的提示. Console会提示你xml文件错误在哪里 修改完xml文件之后 clean你的项目,再build你的项目 R.java会重新出现或更新 Android 在开发中会自动生成一个 R.java 文件 ,这个文件是自动生成的,最好不要

  • WIN2003 IIS相关错误的解决方法

    我碰到的主要问题是:"Server Application Unavailable 错误"."无法显示网页": 1.如果你的.NET版本是2.0及以上的话,那要注意了:win2003是默认安装1.1的,安装.NET2.0 后,可能会程序应用程序池冲突,具体查看这篇问题:服务器应用程序不可用(server application unavailable)的解决办法 , 用cmd指令打开这个路径:C:\WINDOWS\Microsoft.NET\Framework\v(

  • 在Ubuntu 16.10安装mysql workbench报未安装软件包 libpng12-0错误的解决方法

    1.安装mysql workbench,提示未安装软件包 libpng12-0 下载了MySQL Workbench 6.3.8 在安装的时候报错: sudo dpkg -i mysql-workbench-community-6.3.8-1ubu1604-amd64.deb 提示:未安装软件包 libpng12-0. 然而使用sudo apt-get -f install后还是报错,后来找到下载libpng12-0的地址并安装. 2.下载安装libpng12-0 下载libpng12-0地址:

  • 基于webpack-hot-middleware热加载相关错误的解决方法

    错误1:找不到__webpack_hmr GET http://127.0.0.1/__webpack_hmr 404 (Not Found) 在webpack的entry配置添加引用路径'webpack-hot-middleware/client?path=/__webpack_hmr&timeout=10000&reload=true',相关的参数最好不要省略,否则会出现无法自动刷新的问题. 处理脚本如下: // 准备webpack配置信息 let hotMiddlewareScrip

  • centos6.5 编译安装lamp以及相关错误的解决方法

    一.准备工作   1.安装编译工具gcc.gcc-c++ 注意解决依赖关系,推荐使用yum安装,若不能联网可使用安装光盘做为yum源-- 1)编辑yum配置文件: #mount /dev/cdrom /mnt/cdrom #vi /etc/yum.repos.d/CentOS-Media.repo [c5-media] name=CentOS-$releasever- Media baseurl=file:///mnt/cdrom   * 修改为光盘挂载点            file:///

  • Win8.1下安装Python3.6提示0x80240017错误的解决方法

    Win8.1下安装Python3.6提示0x80240017错误,如何解决? 定位原因 缺少Windows补丁KB2999226 解决方法 到Microsoft Download Center下载所需要的补丁,但是可能出现此更新不适用于您的计算机的问题,下面提供几个处理的方法: 1.下载的补丁是32位还是64位,跟你的计算机是否匹配(x86代表32位,x64代表64位),若不匹配请回到官网下载相关补丁 2.Win8.1补丁更新必须按照以下顺序:KB2887595.KB2919442.KB2919

  • php命令行(cli)模式下报require 加载路径错误的解决方法

    今天,同事突然告诉我,我写的一个做计划任务的php脚本执行总是不成功. 脚本本身很简单,里面只有包含了几个库文件并执行了一个函数,函数应该没有错误,这个函数在别处也调用过,没有问题.我在本地用浏览器访问页面,执行成功,看来没有问题,我有点怀疑是同事的计划任务的问题.我又打开命令行,用php直接执行脚本,这回报错了,是require 包含文件错误,看来是路径不对. 不明白是什么原因引起的,只是从报错来看是路径不对,我猜测是跟相对路径有关,于是把相对路径的全部改成绝对路径,再执行,问题解决. 在百度

  • linux系统下部署项目访问报404错误的解决方法

    碰到了一个比较奇怪的问题,我在linux系统上安装了一个tomcat服务器,我将一个项目部署到了这个服务器上,然后我去访问这个tomcat,访问成功: 紧接着,我访问我部署项目的index.jsp页面,出现了404: 找了好久问题,最后发现当我把web.xml文件中的filter等注释掉后,可以正常访问: 注释掉后,我又访问了一下,是可以访问的: 暂时还没太明白这是什么问题,我又找了一个一样的项目,这次是可以访问的,具体原因还不清楚,本人觉得是文件权限问题,但是查了一下权限是一样的,可能和roo

  • IE11下使用canvas.toDataURL报SecurityError错误的解决方法

    发现问题 最近在项目中用到了 canvas 的 toDataURL 方法来获取图片的 base64 格式数据,用以上传到后台.由于之前也遇到过 canvas 被跨域图片污染不能获取数据的坑,因此这回一开始就机智的把 crossOrigin 属性值加上,代码大概如下: const canvas = document.createElement("canvas"); const context = canvas.getContext("2d"); context.fil

随机推荐