Mysql提升大数据表拷贝效率的解决方案

2024-12-21 20:36:27

前言

本文主要给大家介绍了关于Mysql提升大数据表拷贝效率的相关内容，分享出来供大家参考学习，我们大家在工作上会经常遇到量级比较大的数据表；

场景: 该数据表需要进行alter操作比如增加一个字段,减少一个字段. 这个在一个几万级别数据量的数据表可以直接进行alter表操作,但是要在一个接近1000W的数据表进行操作,不是一件容易的事；

可能情况:

1.导致数据库崩溃或者卡死

2.导致其他进程进行数据库读写I/O变慢

3.还有一个可能就是数据格式不一致导致数据无法写入(比如一个varchar类型要改为int类型,当数据长度过大时会报错)

解决方案:--

1.重新创建一张数据表 create new_table select * from old_table 这种形式相当于复制一张新的数据表 ----(不建议): 这里面仅仅复制数据表的字段和数据 , 但是表结构主键,索引和默认值都不会拷贝过来

2.分成两个步骤

1). create new_table like old_table 创建一个新表,表结构和old_table一致(包含主键,索引和默认值等)

2). insert into new_table select * from old_table 把old_table的数据全部拷贝到new_table里面去

----(如果数据量少的话,在几万行左右建议使用此方案, 如果数据量到达数百万上千万时, 这个也是不适用的)

扩展: 如果你只要拷贝一部分数据表的话,可以指定 insert into new_table (字段1,字段2) select 字段1,字段2 from old_table [limit n,m] ；

1).通过select from into outfile 命令来导出数据表数据

2).通过load data infile into 命令来导入数据表数据

不多废话直接看图,感受下100万左右的数据量方案2 和方案3 处理速度相差多少

>select * from money_info into outfile '/var/lib/mysql-files/money.txt';
>create table money_info_cyq11 like money_info;
>load data infile '/var/lib/mysql-files/money.txt' into table money_info_cyq11;

>create table money_info_cyq22 like money_info;
>insert into money_info_cyq22 select * from money_info;

速度在4倍左右,网上说的20倍还没体验到[捂脸]

注:这里还存在一个问题

outfile的目录是有要求的

>show variables like '%secure%';

通过这条命令可以看到secure_file_priv 对应out_file的目录在哪个位置 , 指定这个位置导出即可；

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，如果有疑问大家可以留言交流，谢谢大家对我们的支持。

MySQL备份与恢复之热拷贝（4）

在上一篇文章中我们提到热备,热备也就是在MySQL或者其他数据库服务在运行的情况下进行备份.本文分享另外一种备份的方法,也就是热拷贝.热拷贝跟热备很类似,只不过热备使用mysqldump命令,热拷贝使用mysqlhotcopy命令.热拷贝的优势在于支持服务运行中进行备份,速度快,性能好:劣势在于只能备份MyIsam的表,无法备份InnoDB的表.所以在生产环境中应该酌情使用. 示意图热备模拟第一步,热拷贝 [root@serv01 databackup]# mysqlhotcopy -uro
MySQL中大数据表增加字段的实现思路

前言增加字段相信大家应该都不陌生,随手就可以写出来,给 MySQL 一张表加字段执行如下 sql 就可以了: ALTER TABLE tbl_tpl ADD title(255) DEFAULT '' COMMENT '标题' AFTER id; 但是线上的一张表如果数据量很大呢,执行加字段操作就会锁表,这个过程可能需要很长时间甚至导致服务崩溃,那么这样操作就很有风险了. 那么,给 MySQL 大表加字段的思路如下: ① 创建一个临时的新表,首先复制旧表的结构(包含索引) create tab
mysql 通过拷贝数据文件的方式进行数据库迁移实例

mysql通过拷贝数据文件的方式进行数据库迁移 --环境windows 将源机器A数据库拷贝到目标机器B: 我先在目标机器B上安装MySQL,停止mysql服务,然后将源机器A的data下关于数据库的文件和ibdata1拷贝过去,其余不用拷贝.如图: 源机器A: 启动目标数据库服务net start mysql,即可查看到导过来的所有数据库了. 注意:ibdata1一定不要忘记拷贝,且要拷贝到准确的位置(如我目标机器的ibdata1在E:\MySQL Datafiles,不在data路径下,我就
Mysql提升大数据表拷贝效率的解决方案

前言本文主要给大家介绍了关于Mysql提升大数据表拷贝效率的相关内容,分享出来供大家参考学习,我们大家在工作上会经常遇到量级比较大的数据表 : 场景: 该数据表需要进行alter操作比如增加一个字段,减少一个字段. 这个在一个几万级别数据量的数据表可以直接进行alter表操作,但是要在一个接近1000W的数据表进行操作,不是一件容易的事: 可能情况: 1.导致数据库崩溃或者卡死 2.导致其他进程进行数据库读写I/O变慢 3.还有一个可能就是数据格式不一致导致数据无法写入(比如一个var
MySQL提升大量数据查询效率的优化神器

目录前言查看SQL执行频率定位低效率执行SQL explain分析执行计划 trace分析优化器执行计划使用索引优化 SQL优化大量插入数据优化insert语句优化order by语句 2.两种排序方式 3.Filesort 的优化优化group by 子查询优化 limit优化前言在应用的的开发过程中,由于初期数据量小,开发人员写 SQL 语句时更重视功能上的实现,但是当应用系统正式上线后,随着生产数据量的急剧增长,很多 SQL 语句开始逐渐显露出性能问题,对生产的影响也越
Mysql数据库中数据表的优化、外键与三范式用法实例分析

本文实例讲述了Mysql数据库中数据表的优化.外键与三范式用法.分享给大家供大家参考,具体如下: 数据表优化将商品信息表进行优化 1.创建商品种类表: create table if not exists goods_cates( id int unsigned primary key auto_increment, name varchar(40) not null ); 2.将商品种类写入商品种类表中: 注意:插入另一个表的查询结果不需要加values insert into goods_
MySQL 常见的数据表设计误区汇总

误区一:过多的数据列 MySQL 存储引擎的 API 是按照行缓冲区方式从服务端和存储引擎复制数据.服务端将缓冲区数据解码成数据列.然而,将行缓冲区的格式转换为数据行数据结构的列可能会代价很高.MyISAM 固定使用与服务端匹配的行格式,因此无需转换.然而,MyISAM 的可变行格式以及 InnoDB 的行格式总是需要进行转换.转换的代价依赖于列的数量.如果当数据表的列超过上百列的时候,会引起很高的 CPU 资源消耗--即便是使用到的列很少.曾经看过一篇文章,指的是一个多语言的解决方案,直接简单
MySQL 数据库中数据表超详细的基本操作

目录 1. 查看当前数据库中的表 2. 创建表 3. 查看指定表结构 4. 删除表 5. 往表中新增数据 6. 查找表中的数据 6.1 全列查询 6.2 指定列查询 6.3 查询字段为表达式 6.4 给某个列指定常量 6.5 给查询的表达式指定别名(as) 6.6 去重查询(distinct) 6.7 对查询结果进行排序(order by) 6.8 条件查询(where) 6.9 分页查询(limit) 7. 修改表中的数据 8. 删除表中的数据前言: 库名.表名.列名等等不能和关键字相同,如
MySQL如何构建数据表索引

理解索引概念最简单的方式是通过一个案例来进行,以下就是这样的一个案例. 假设我们需要设计一个在线的约会网站,这个网站的用户资料有许多列,例如国籍.省份.城市.性别.年龄.眼睛颜色等等.这个网站必须支持通过多种组合方式搜索用户资料.同时,也需要支持支持排序和根据用户最近在线时间和其他用户的评价返回有限的结果等等.对于这种复杂场景我们如何设计索引? 有点奇怪,首先要做的事情是要决定我们是否必须使用索引排序,或者检索后再排序是否能够接受.索引排序限制了索引和查询构建的方式.例如,在WHERE age
MySQL 索引和数据表该如何维护

查找和修复数据表冲突数据表最糟糕的事情就是发生冲突.使用MyISAM存储引擎时,通常因为崩溃导致冲突.然而,当存在硬件故障.MySQL内部Bug或操作系统Bug时,所有的存储引擎都可能遭受索引冲突. 冲突的索引可能导致查询返回错误的结果,在没有重复值时的重复索引错误增加,甚至可能导致全表扫描或崩溃.如果你遇到过偶发的事件,例如一个你认为不会发生的错误,这个时候运行CHECK TABLE命令去检测数据表是否有冲突(注意有些数据库引擎不支持这个命令,有些则支持多种选项参数去指定如何检测表).通常,
MySQL高级特性——数据表分区的概念及机制详解

MySQL 的分区的实现方式是对数据表进行一层包装,这意味着索引实际是基于每个分区定义的,而不是整张表.这个特性和 Oracle 是不同的,在 Oracle 中的索引和数据表可以使用更灵活和更复杂的方式进行分区. MySQL 的分区通过定义 PATITION BY 子句的条件来决定数据行所属分区的归属.在执行查询的时候,查询优化器会区分所在分区,这意味着查询不会检查全部分区,而仅仅是那些包含索要查询数据所在的分区. 分区的主要目的是对数据表进行大致形式的索引和聚集.这样可以减少数据表的过大范
MYSQL优化之数据表碎片整理详解

目录在MySQL中,我们经常会使用VARCHAR.TEXT.BLOB等可变长度的文本数据类型.不过,当我们使用这些数据类型之后,我们就不得不做一些额外的工作——MySQL数据表碎片整理. 那么,为什么在使用这些数据类型之后,我们就要对MySQL定期进行碎片整理呢? 现在,我们先来看一个具体的例子.在这里,我们使用如下SQL语句在MySQL自带的TEST数据库中创建名为DEMO的数据表并插入5条测试数据. --创建DEMO表 CREATE TABLE DEMO( id int unsigned,
如何将Oracle的一个大数据表快速迁移到 Sqlserver2008数据库(图文教程)

oracle 服务器版本 11.2.0.1.0 Sqlserver2008 R2 前提条件是 SQLSERVER服务器上安装了Oracle客户端并且进行了配置不会配置的请参照这个链接 1 登录MSSM 工具 2 选中其中一个数据库右键⇒任务⇒导入数据 3 打开窗口 Sqlserver导入和导出向导点击下一步 4 进入选择数据源画面 a: 数据源选择 Microsoft OLE DB Provider for Oracle 然后点击右侧的属性按钮 5 数

Mysql提升大数据表拷贝效率的解决方案

相关推荐

随机推荐