mysql 如何动态修改复制过滤器

2025-02-14 02:38:04

MySQL动态修改复制过滤器

说说今天遇到的问题吧，今天在处理一个业务方的需求，比较变态，我大概描述一下：

1、线上的阿里云rds上面有个游戏的日志库，里面的表都是日表的形式，数据量比较大了，每次备份的时候，都会导致线上的rds报警，报警内容是IO资源占用过多。

2、这个rds上有一个本地的ECS只读从库，这个只读从库会实时同步线上的rds数据库中的数据，这个只读从库供业务方查询使用

3、业务方说这些数据都还有用，只读从库上的数据必须有，线上rds上的数据可以删除，保留两个星期即可。

场景就是这么个场景，DBA想要解决报警这个问题，业务方想要保证拥有完整的数据。请问，怎么解决？

当时看到这个问题，我想骂人，这需求一看就不合理，哪儿有删除一个库，另外一个库上还保留的道理，况且都是些日志数据，不直接搞个冷备份，然后删除线上，搞这么一出干啥啊。但是啊，怎么说也没有缓和的余地，于是就开始思考这个问题应该怎么解决。我想到的解决办法有以下几个：

1、扩容，提升性能。数据量大，扩磁盘呗，IO使用率高，提升性能么，这是最直接的解决办法，也是最贵的解决办法，首先被砍掉。

2、先备份再删除再还原。rds主库上提前备份日表数据，然后删除数据，此时从库会同步删除数据，然后再将第一步备份的数据还原到从库上。这个办法从可行性上来讲是可以的，因为保证了没有数据丢失。但是操作起来比较麻烦，手续太多，不够方便。

3、使用replicate-ignore-table参数进行对于指定的表进行过滤。设置了这个参数，可以让你过滤指定数据表的所有操作。我们看看官方文档对这个参数的描述，给个链接：https://dev.mysql.com/doc/refman/5.7/en/replication-options-slave.html#option_mysqld_replicate-wild-ignore-table

描述如下：

Creates a replication filter which keeps the slave thread from replicating a statement in which any table matches the given wildcard pattern. To specify more than one table to ignore, use this option multiple times,

上面的意思是你可以使用这个参数创建一个过滤器，从而过滤掉匹配你制定的规则的特定表的操作（听着很绕口），就是说你可以制定过滤规则，加入规则中制定了表a，那么表a的操作就不会同步到从库中了。

这和我们的需求符合，也就是我们如果设置了要过滤的表，那么当我们进行删除表操作的时候，从库中不会对表进行删除，就实现了我们想要的结果。测试一下这个功能吧：

首先我们创建数据库test_ignore，然后在其中创建表：

主库上操作：

mysql :test_ignore >>show tables;
Empty set (0.00 sec)

mysql :test_ignore >>create table aaa (id int not null);
Query OK, 0 rows affected (0.19 sec)

mysql :test_ignore >>create table aab (id int not null); 
Query OK, 0 rows affected (0.01 sec)

mysql :test_ignore >>create table aac (id int not null); 
Query OK, 0 rows affected (0.00 sec)

mysql :test_ignore >>create table aad (id int not null); 
Query OK, 0 rows affected (0.01 sec)

mysql :test_ignore >>create table aae (id int not null); 
Query OK, 0 rows affected (0.01 sec)

从库上查看：

mysql :test_ignore >>show tables;
+-----------------------+
| Tables_in_test_ignore |
+-----------------------+
| aaa                   |
| aab                   |
| aac                   |
| aad                   |
| aae                   |
+-----------------------+
5 rows in set (0.00 sec)

发现已经同步过来了。此时是处于主从同步状态，如果现在我们在主库上删除表，那么从库上的表一定会删除，这不是我们想要的结果。

很显然，接下来的一步是配置replicate-wild-ignore-table这个参数了，一般情况下，我们需要通过停止从库的服务进行my.cnf文件的配置，如果我们要配置多个表，则需要在my.cnf文件中写多条通配的记录。例如，在本例子中，需要配置该参数的值为test_ignore.aa%,其中%代表通配符，也就是说，test_ignore数据库中形如aa%这种格式的表操作都会被过滤掉。而我们创建的表aaa、aab、aac、aad、aae都是形如这种的，所以针对这几个表的操作一定不会同步到从库了，我们测试一下：

首先查看当前的复制状态：

双Yes状态，说明复制关系没有问题

主库进行操作：

mysql :test_ignore  >>drop table aaa;
Query OK, 0 rows affected (0.01 sec)

mysql :test_ignore  >>drop table aab;
Query OK, 0 rows affected (0.00 sec)

从库上进行查看：

mysql :test_ignore  >>show tables;
+-----------------------+
| Tables_in_test_ignore |
+-----------------------+
| aaa                   |
| aab                   |
| aac                   |
| aad                   |
| aae                   |
+-----------------------+
5 rows in set (0.00 sec)

从库上的表还在，说明主库上的操作没有被同步到从库，我们配置的参数

replicate-wild-ignore-table=test_ignore.aa%

起作用了。此时，如果我们在主库上创建一个表：

`主库`
mysql :test_ignore  >>create table aaf(id int);
Query OK, 0 rows affected (0.00 sec)

`从库`
mysql :test_ignore  >>show tables;
+-----------------------+
| Tables_in_test_ignore |
+-----------------------+
| aaa                   |
| aab                   |
| aac                   |
| aad                   |
| aae                   |
+-----------------------+
5 rows in set (0.00 sec)

发现从库并没有同步主库的表aaf，因为aaf也匹配了test_ignore.aa%这条规则。

利用这个特性，我们能够很好的解决这个业务场景，也就是主库删除，从库保留数据。但是，这里要说但是了，这个方法有一个比较严重的问题，就是每次都需要重启从库，如果我们需要配置第二条规则，第三条规则，则需要重启从库2次，3次，这个过程中，从库对于业务方是不可见的，如果无法访问，很可能造成程序报错，这是我们不能忍受的。

这个过程肯定是要解决的，怎么解决呢？能不能找到不停机就能修改复制过滤器的方法？找找官方文档。

果然，停机是不可能停机的，这辈子都不可能停机。官方文档中有这么一句话：

You can also create such a filter by issuing a CHANGE REPLICATION FILTER REPLICATE_WILD_IGNORE_TABLE statement.

我去，这是个啥语句，表示从来没有用过，可以通过在线变更复制过滤器的方法来对过滤器进行修改，看看官方文档中的介绍：

看到了一个神奇的语句，赶紧来试试：

mysql :test_ignore  >>change replication filter replicate_wild_ignore_table=('test_ig%.aa%');
ERROR 3017 (HY000): This operation cannot be performed with a running slave sql thread; run STOP SLAVE SQL_THREAD first

mysql :test_ignore  >>stop slave;
Query OK, 0 rows affected (0.00 sec)

mysql :test_ignore  >>change replication filter replicate_wild_ignore_table=('test_ig%.aa%');
Query OK, 0 rows affected (0.00 sec)

mysql :test_ignore  >>start slave;
Query OK, 0 rows affected (0.01 sec)

直接使用，提示需要stop slave sql_thread，想想也能理解，不停止复制直接修改复制的规则好像有点不妥，索性停止了整个复制，然后重新修改复制过滤器，妥了，成功执行，开启复制，一套操作行云流水。

再来看看复制关系中的状态：

忽略的表规则已经变成了test_ig%.aa%，也就是说，以test_ig开头的数据库中以aa开头的表的操作，都不会被同步到从库，包括对表的alter和drop以及create操作。

但这里，方案就出来了，我们知道，日表一般是YYYYMMDD这种形式的，我们只要过滤YYYYMM%这种格式的日表，然后在主库上对它进行删除，这个操作将不会被同步到从库，那么这个问题就可以顺利解决了。

当然，除了这个方案之外，还有一些方案，例如：

如果业务容忍部分数据丢失，我们还可以使用关闭binlog---删表---打开binlog的方式使得从库不会同步主库的drop操作；

线上所有的日表操作都配置成ignore，然后利用触发器将日表中的更新同步到从库中；

这一系列的操作，其实不是从本质上解决问题，本质上还是业务设计的问题，日表中的打点日志太多，可以适当减少这些打点日志，对于打点日志，需要确定保留周期，过期的日志，需要及时清理，保证服务器的指标和性能。

以上就是mysql 如何动态修改复制过滤器的详细内容，更多关于MySQL动态修改复制过滤器的资料请关注我们其它相关文章！

MySQL全面瓦解之查询的过滤条件详解

概述在实际的业务场景应用中,我们经常要根据业务条件获取并筛选出我们的目标数据.这个过程我们称之为数据查询的过滤.而过滤过程使用的各种条件(比如日期时间.用户.状态)是我们获取精准数据的必要步骤, 这样才能得到我们期望的结果.所以本章我们来学习MySQL中查询过滤条件的各种用法. 关系运算关系运算就是where语句后跟上一个或者n个条件,满足where后面条件的数据会被返回,反之不满足的就会被过滤掉.operators指的是运算符 ,有如下几种情况: 运算符说明 = 等于 <> 或者 !=
python实现mysql的单引号字符串过滤方法

本文实例讲述了python实现mysql的单引号字符串过滤方法.分享给大家供大家参考,具体如下: 最主要用这个函数,可以处理MySQLdb.escape_string(content). class Guide: def __init__(self): self.time_zone = 7*3600 #设置时区 self.now_time = int(time.time()) + self.time_zone #取得当前时间 #本地 self.gamedb_model = mysql_conn.
mysql 复制过滤重复如何解决

1.replicate_do_db 和 replicate_ignore_db 不要同时出现.容易出现混淆.也是毫无意义的. Replicate_Do_DB: db1 Replicate_Ignore_DB: db2 statement模式: 使用use 语句 use db1;insert into tb1 values (1); use db2;insert into tb2 values (2); 以上在slave上均能正确复制,tb1 有数据,tb2没有数据. 不使用use 语句 inse
Python连接MySQL并使用fetchall()方法过滤特殊字符

来一个简单的例子,看Python如何操作数据库,相比Java的JDBC来说,确实非常简单,省去了很多复杂的重复工作,只关心数据的获取与操作. 准备工作需要有相应的环境和模块: Ubuntu 14.04 64bit Python 2.7.6 MySQLdb 注意:Ubuntu 自带安装了Python,但是要使用Python连接数据库,还需要安装MySQLdb模块,安装方法也很简单: sudo apt-get install MySQLdb 然后进入Python环境,import这个包,如果没有报
MySQL中无过滤条件的count详解

count(*) 实现 1.MyISAM:将表的总行数存放在磁盘上,针对无过滤条件的查询可以直接返回如果有过滤条件的count(*),MyISAM也不能很快返回 2.InnoDB:从存储引擎一行行地读出数据,然后累加计数由于MVCC,在同一时刻,InnoDB应该返回多少行是不确定样例假设表t有10000条记录 session A session B session C BEGIN; SELECT COUNT(*) FROM t;(返回10000) INSERT INTO t;(插入一行)
mysql完整备份时过滤掉某些库的方法

mysql进行完整备份时使用--all-database参数比如: #mysqldump -u root -h localhost -p --all-database > /root/all.sql 数据导入的时候,可以先登陆mysql数据库中,使用source /root/all.sql进行导入. 问题: 想要在mysqldump备份数据库的时候,过滤掉某些库. 这种情况mysqldump备份的时候就不能使用--all-database了,而是使用--database. 如下:备份数据库的时
MYSQL使用正则表达式过滤数据

一.正则与LIKE的区别 Mysql的正则表达式仅仅使SQL语言的一个子集,可以匹配基本的字符.字符串. 例如:select * from wp_posts where post_name REGEXP'hello',可以检索出列post_name中所有包含hello的行 REGEXP'.og' .是正则表达式中里一个特殊的字符.它表示匹配一个字符,因此,dog,hog,mog等等都能匹配. 注意: 关于LIKE和REGEXP的区别:LIKE匹配整个列.如果被匹配的文本仅在列值中出现,LIKE
MySQL注入绕开过滤的技巧总结

首先来看GIF操作: 情况一:空格被过滤使用括号()代替空格,任何可以计算出结果的语句,都可以用括号包围起来: select * from(users)where id=1; 使用注释/**/绕过空格: select * from/**/users/**/where id=1; 情况二:限制from与某种字符组合在from后加个点.即使用from.来代替from: select * from. users where id=1; 再直接看GIF: 说白了,就是将'字段名 '替换成hex: 这
MYSQL必知必会读书笔记第六章之过滤数据

mysql简介 MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理. where子句的位置,在同时使用ORDER BY 和WHERE子句时应该让ORDER BY 位于where之后,否则会产生错误. 1.不匹配检查复制代码代码如下: SELECT vend_id FROM products where vend_id <>1003 等同于复制代码代码如下: SELECT vend_id
MYSQL必知必会读书笔记第八章之使用通配符进行过滤

mysql简介 MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理. 使用通配符的技巧: 1.不要过度使用通配符.如果其他操作符能达到通配符相同的效果,应该优先的使用其他操作符 2.在确实需要使用通配符时,除非绝对有必要,否则不要把它们用在搜索模式的开始处.把通配符置于搜索模式的开始处,搜索起来是最慢的. 3.仔细注意通配符的位置,如果放错了地方,可能不会返回想要的结果注意事项: 区分大小写:
Mysql数据库实现多字段过滤的方法

我国移动互联网进入了飞速发展阶段,互联网人才日益受到企业的重视,其中PHP开发人才便是其中之一,在互联网旅游.金融.餐饮.娱乐.社交等一些新兴企业与软件开发企业中,PHP开发岗位相对占有核心地位,今天给大家分享的技术知识是-- mysql数据库如何实现多字段过滤. 1.多字段过滤查询类比现实:查询公司中户籍是北京的.年龄超过30岁.性别是男的同事信息; 查询场景:查询商品名称是'King doll'.商品价格是9.49的商品. 查询SQL: SELECT prod_id, prod_name,
MySQL单表查询操作实例详解【语法、约束、分组、聚合、过滤、排序等】

本文实例讲述了MySQL单表查询操作.分享给大家供大家参考,具体如下: 语法一.单表查询的语法 SELECT 字段1,字段2... FROM 表名 WHERE 条件 GROUP BY field HAVING 筛选 ORDER BY field LIMIT 限制条数二.关键字的执行优先级(重点) 重点中的重点:关键
MYSQL必知必会读书笔记第七章之数据过滤

mysql简介 MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言--结构化查询语言(SQL)进行数据库管理. 计算次序: where 可以包含任意数目的and和or,允许两者结合以进行复杂和高级的过滤.但是SQL在操作or之前会优先的处理AND操作符.如果想优先的使用or的条件可以使用括号. in:为什么要使用in操作符?其优点具体如下. 1.在使用长的合法选项清单时,in操作符的语法更清楚直观 2.在使用IN时,计算的次序更容易管理

mysql 如何动态修改复制过滤器

相关推荐

随机推荐