MySql更新优化策略

2025-02-28 00:56:50

模拟场景一：

给数据库中的一张表的结构调整，添加几个字段，后面对之前的数据进行刷新，刷新的内容是对其中的一个已有字段url进行匹配，然后更新新加的字段type和typeid。

后来就写了个shell脚本来刷数据，结果运行shell脚本后我就懵了，怎么这么慢~~~

情景再现

代码如下:

CREATE TABLE `fuckSpeed` (
`uin` bigint(20) unsigned NOT NULL DEFAULT 0,
`id` int(11) unsigned NOT NULL DEFAULT 0,
`url` varchar(255) NOT NULL DEFAULT '',
`type` int(11) unsigned NOT NULL DEFAULT 0,
`typeid` varchar(64) NOT NULL DEFAULT '',
......
KEY `uin_id` (`uin`,`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

表结构大概是上面这样的（省略了好多字段），表中只有一个联合索引uin_id，而我在更新的时候是下面的思路：

首先根据一个id范围获取到一定数量的数据

代码如下:

select id,url from funkSpeed where id>=101 and id<=200;

遍历所有的数据，对每一条数据进行更新

#首先对数据进行处理，匹配获取type和typeid

代码如下:

update fuckSpeed set type=[type],typeid=[typeid] where id=[id]

按照上面的思路搞了之后，发现更新特别的慢，平均每秒钟3~5个左右，我也是醉了，我看看要更新的数据，总共有32w+条，这样更新下来大概需要24h+，也就是1天还要多，额~~哭了，想想肯定是哪里出问题了。

发现问题
首先我想到的是是不是因为只有一个进程在更新，导致很慢，我启动了5个进程，将id分段了，就像下面这样

代码如下:

./update_url.sh 0 10000 &
./update_url.sh 10000 20001 &
./update_url.sh 20001 30001 &
./update_url.sh 30002 40002 &
./update_url.sh 40003 50003 &

运行之后发现还是那样，速度没有提升多少，还是每秒钟更新3~5个左右，想想也是啊，时间不可能花费在插入数据之前的那些步骤（匹配、组装sql语句、。。。），应该是插入的时候有问题

再来看看我的sql语句

代码如下:

select id,url from funkSpeed where id>=101 and id<=200;，

这里，试着在命令行执行了下，结果如下

代码如下:

mysql> select id,url from funkSpeed where id>=0 and id<=200;
Empty set (0.18 sec)

竟然花了0.18秒，这个时候我猜恍然大悟，联合索引我没有使用到，联合索引生效的条件是——必须要有左边的字段，用explain验证下，果然是这样：

代码如下:

然后使用联合索引：

代码如下:

mysql> select uin,id from funkSpeed where uin=10023 and id=162;
+------------+----------+
| uin | id |
+------------+----------+
| 10023 | 162 |
+------------+----------+
1 row in set (0.00 sec)

可以看到几乎是秒查，这个时候基本可以断定问题是出现在索引这个地方了

我select的时候次数比较少，每两个select之间id相差10000，所以这里可以忽略掉，而且这里没办法优化，除非在id上面添加索引。

问题发生在

代码如下:

update fuckSpeed set type=[type],typeid=[typeid] where id=[id]

这里在更新的时候也是会用到查询的，我的mysql版本是5.5，不能explain update，不然肯定可以验证我所说的，这里要更新32w+条数据，每条数据都会去更新，每条数据0.2s左右，这太吓人了~~

解决问题
问题找到了，解决起来就容易多了~~

select的时候加了一个字段uin，改为下面这样

代码如下:

select uin,id,url from funkSpeed where id>=101 and id<=200;

然后更新的时候使用

代码如下:

update fuckSpeed set type=[type],typeid=[typeid] where uin=[uin] id=[id]

这样一来索引就是用上了。

三下五除二改好了代码，试着启动了一个进程，看看效果如何，果然，效果提升的不是一点点，平均30+次/s，这样大概3个小时左右就可以完成所有的更新了。

模拟场景二：
需求6个表 pid字段写到对应的brand_id字段

问题sql背景：项目有6个表的要根据pid字段要写入对应的brand_id字段。但是这个其中有两个表是千万级别的。我的worker运行之后，线上的mysql主从同步立刻延迟了！运行了一个多小时之后，居然延迟到了40分钟，而且只更新了十几万行数据。问题sql如下：

代码如下:

<update id="updateBrandIdByPid" parameterClass="com.jd.chat.worker.domain.param.UpdateBrandIdParam">
        UPDATE $tableName$
        SET brand_id = #newBrandId#
        WHERE pid = #pid#
            AND brand_id = 0
    </update>

项目组的mysql专家帮我分析了下，因为pid字段没有索引，mysql引擎要逐行扫描出与传入的pid值相等的列，然后更新数据，也就是要扫描完1000W+行磁盘数据才能执行完这个sql。更严重的是，这个千万级的表里面有多少个不同的pid，我就要执行多少个这样的sql。
同事给我的建议的根据id字段进行sql代码层次的纵向分表。每次更新1000行的数据，这样mysql引擎就不用每次在扫全表了，数据库压力是之前的万分之一。而且id作为主键，是有索引的有索引，有索引能大大优化查询性能，优化后的sql如下：

代码如下:

仅仅用了id限区间的语句，将一个千万级的大表代码层次上进行纵向切割。重新上线worker后，mysql主从没有任何延迟！而且经过监视，短短10分钟就更新了十几万数据，效率是之前的6倍！更重要的是数据库负载均衡，应用健康运行。

以上通过两个问题模拟场景再现分析MySql更新优化策略，希望对大家在数据库方面有所帮助。

详解Mysql多表联合查询效率分析及优化

1. 多表连接类型 1. 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如: SELECT * FROM table1 CROSS JOIN table2 SELECT * FROM table1 JOIN table2 SELECT * FROM table1,table2 由于其返回的结果为被连接的两个数据表的乘积,因此当有WHERE, ON或USING条件的时候一般不建议使用,因为当数据表项目太多的时候,会非常慢.一般使用LE
MySQL下的RAND()优化案例分析

众所周知,在MySQL中,如果直接 ORDER BY RAND() 的话,效率非常差,因为会多次执行.事实上,如果等值查询也是用 RAND() 的话也如此,我们先来看看下面这几个SQL的不同执行计划和执行耗时. 首先,看下建表DDL,这是一个没有显式自增主键的InnoDB表: [yejr@imysql]> show create table t_innodb_random\G *************************** 1. row *************************
12个优化MySQL的技巧小整理

避免编辑转储文件 Mysqldump创建的转储文件原本是无害的,但它很容易被尝试去编辑.然而,人们应该知道在任何情况下的试图修改这些文件被证明是有危险的.直观地看对这些文件的改动会导致数据库损坏,从而导致系统的退化.为了让你的系统免受任何麻烦,你必须避免编辑MySQL转储文件. MyISAM 块大小大多数开发者忘记了这一事实,文件系统往往需要一个大的MyISAM块以保证高效运行.许多开发者不知道块大小的设置..MYI文件存储在myisam_block_size的设置里,这个设置项可用来修改大
详解MySQL性能优化（一）

一.MySQL的主要适用场景 1.Web网站系统 2.日志记录系统 3.数据仓库系统 4.嵌入式系统二.MySQL架构图: 三.MySQL存储引擎概述 1)MyISAM存储引擎 MyISAM存储引擎的表在数据库中,每一个表都被存放为三个以表名命名的物理文件.首先肯定会有任何存储引擎都不可缺少的存放表结构定义信息的.frm文件,另外还有.MYD和.MYI文件,分别存放了表的数据(.MYD)和索引数据(.MYI).每个表都有且仅有这样三个文件做为MyISAM存储类型的表的存储,也就是说不管这个表有
大幅优化MySQL查询性能的奇技淫巧

回顾 MySQL / InnoDB 的改善历史.你能很容易发现.在MySQL 5.6稳定版本中从来没有在read-only 这么快的提速,它很容易搞懂,以及在read-only(RO)有着良好的扩张性.也很期待它在read+write(RW)上达到一个较高水平.(特别是在读取数据是数据库主要工作的时候) 然而.我们对于RO在 MySQL 5.6的表现也十分的高兴,在5.7这个版本中,主要工作集中在 read+write (RW)上, 因为在大数据的处理上还没能达到我们的期望.但是RW依赖RO下.
探究MySQL优化器对索引和JOIN顺序的选择

本文通过一个案例来看看MySQL优化器如何选择索引和JOIN顺序.表结构和数据准备参考本文最后部分"测试环境".这里主要介绍MySQL优化器的主要执行流程,而不是介绍一个优化器的各个组件(这是另一个话题). 我们知道,MySQL优化器只有两个自由度:顺序选择:单表访问方式:这里将详细剖析下面的SQL,看看MySQL优化器如何做出每一步的选择. explain select * from employee as A,department as B where A.LastName = '
MySQL 5.5.x my.cnf参数配置优化详解

一直有耳闻MySQL5.5的性能非常NB,所以近期打算测试一下,方便的时候就把bbs.kaoyan.com升级到这个版本的数据库.今天正好看到一篇有关my.cnf优化的总结,虽然还没经过我自己的实践检验,但从文章内容来说已经写的很详细了(当然,事实上下面这篇文章很多地方只是翻译了my.cnf原始配置文件的说明,呵呵),所以特地转载收藏一下,大家在对mysql服务器进行优化的时候可以作为参考,并根据实际情况对其中的一些参数进行调整.(特别备注:以下原文中有些参数事实上不适用于mysql5.5,不知
修改Innodb的数据页大小以优化MySQL的方法

我们知道Innodb的数据页是16K,而且是一个硬性的规定,系统里没更改的办法,希望将来MySQL也能也Oracle一样支持多种数据页的大小. 但实际应用中有时16K显的有点大了,特别是很多业务在Oracle或是SQL SERVER运行的挺好的情况下迁到了MySQL上发现IO增长太明显的情况下, 就会想到更改数据页大小了. 实际上innodb的数据页大小也是可以更改的,只是需要在源码层去更改,然后重新rebuild一下MySQL. 更改办法: (以MySQL-5.1.38源码为例
MYSQL更新优化实录

引言今天(August 5, 2015 5:34 PM)在给数据库中一张表的结构做一次调整,添加了几个字段,后面对之前的数据进行刷新,刷新的内容是:对其中的一个已有字段url进行匹配,然后更新新加的字段type和typeid.后来就写了个shell脚本来刷数据,结果运行shell脚本后我就懵了,怎么这么慢~~~ 情景再现 CREATE TABLE `fuckSpeed` ( `uin` bigint(20) unsigned NOT NULL DEFAULT 0, `id` int(11) u
运维角度浅谈MySQL数据库优化(李振良)

一个成熟的数据库架构并不是一开始设计就具备高可用.高伸缩等特性的,它是随着用户量的增加,基础架构才逐渐完善.这篇博文主要谈MySQL数据库发展周期中所面临的问题及优化方案,暂且抛开前端应用不说,大致分为以下五个阶段: 1.数据库表设计项目立项后,开发部根据产品部需求开发项目,开发工程师工作其中一部分就是对表结构设计.对于数据库来说,这点很重要,如果设计不当,会直接影响访问速度和用户体验.影响的因素很多,比如慢查询.低效的查询语句.没有适当建立索引.数据库堵塞(死锁)等.当然,有测试工程师的团队

MySql更新优化策略

相关推荐

随机推荐