mysql建立高效的索引实例分析

本文实例讲述了mysql建立高效的索引。分享给大家供大家参考,具体如下:

如何建立理想的索引?

  • 查询频繁度
  • 区分度
  • 索引长度
  • 覆盖字段

区分度

假设100万用户,性别基本上男/女各为50W, 区分度就低。

长度小

索引长度直接影响索引文件的大小,影响增删改的速度,并间接影响查询速度(占用内存多).

区分度高,长度小

问题:如果让区分度高,而长度小?

答:可以针对列中的值,从左往右截取部分,来建索引

(1)截的越短, 重复度越高,区分度越小, 索引效果越不好
(2)截的越长, 重复度越低,区分度越高, 索引效果越好,但带来的影响也越大–增删改变慢,并间影响查询速度.

所以, 我们要在 区分度 + 长度 两者上,取得一个平衡。惯用手法:截取不同长度,并测试其区分度。

假设我们有一张表:英语4级的单词表,里面有13324条记录,我们怎么给name字段加索引呢?

如果计算区分度?

截取单词第1位的不重复数:

select count(distinct left(name,1)) from dict

总的数量:

select count(*) from dict

区分度:不重复数/总的数量,sql语句如下:

select (select count(distinct left(name,1)) from dict) / (select count(*) from dict) as rate;

然后按照这样的步骤把其他长度所对应的区分度给找出来,看一个这个图表,可以知道当长度为11的时候重复度仅仅为1%,我们可以考虑建立11位长的索引

alter table dict add index name name(11);

左前缀不好区分的情况

对于左前缀不易区分的列 ,建立索引的技巧

如url列

http://www.baidu.com
http://www.web-bc.cn

列的前11个字符都是一样的,不易区分, 可以用如下2个办法来解决

(1)把列内容倒过来存储,并建立索引

moc.udiab.www//:ptth
nc.cb-bew.www//://ptth

这样左前缀区分度大

(2)伪hash索引效果

同时存url和url_hash列

#建表
create table t10 (
id int primary key,
url char(60) not null default ''
);
#插入数据
insert into t10 values
(1,'http://www.baidu.com'),
(2,'http://www.sina.com'),
(3,'http://www.sohu.com.cn'),
(4,'http://www.onlinedown.net'),
(5,'http://www.gov.cn');
#修改表结构,添加urlcrc列
alter table t10 add urlcrc int unsigned not null;

在存储的时候,将url对应的crc32码一同插入到数据库中,然后按照urlcrc字段建立索引,然后查找的时候,我们在业务层中将对应的url转换为crc32进行查找,就可以利用上索引了。

因为crc的结果是32位int无符号数,因此当数据超过40亿,也会有重复,但这是值得的.(索引长度为int4个字节)

多列索引

多列索引的考虑因素—列的查询频率 , 列的区分度, 注意一定要结合实际业务场景

以ecshop商城为例, goods表中的cat_id,brand_id,做多列索引,从区分度看,brand_id区分度更高, 但从 商城的实际业务业务看, 顾客一般先选大分类->小分类->品牌,最终选择建立2个索引:

(1)index(cat_id,brand_id)
(2)index(cat_id,shop_price)

甚至可以再加 (3)index(cat_id,brand_id,shop_price),3个冗余索引

但(3)中的前2列和(1)中的前2列一样,所以可以再去掉(1),建立2个索引

index(cat_id,price)index(cat_id,brand_id,shop_price);

更多关于MySQL相关内容感兴趣的读者可查看本站专题:《MySQL索引操作技巧汇总》、《MySQL常用函数大汇总》、《MySQL日志操作技巧大全》、《MySQL事务操作技巧汇总》、《MySQL存储过程技巧大全》及《MySQL数据库锁相关技巧汇总》

希望本文所述对大家MySQL数据库计有所帮助。

(0)

相关推荐

  • MYSQL索引建立需要注意以下几点细节

    1.建立索引的时机:若表中的某字段出现在select.过滤.排序条件中,为该字段建立索引是值得的. 2.对于like '%xxx'的模糊查询,普通的索引是无法满足的,需要建立全文索引. 3.对于有多个条件的,比如: "...where a=xxx and b=yyy","...where a=xxx order by b","...where a=xxx group by b".需要使用组合索引.但是组合索引只能在SQL语句中满足"最左

  • mysql 添加索引 mysql 如何创建索引

    1.添加PRIMARY KEY(主键索引) mysql>ALTER TABLE `table_name` ADD PRIMARY KEY ( `column` ) 2.添加UNIQUE(唯一索引) mysql>ALTER TABLE `table_name` ADD UNIQUE ( `column` ) 3.添加INDEX(普通索引) mysql>ALTER TABLE `table_name` ADD INDEX index_name ( `column` ) 4.添加FULLTEX

  • mysql创建Bitmap_Join_Indexes中的约束与索引

    测试过程如下:create table sales  as select * from sh.sales: create table customers as  select * from sh.customers: create unique index CUST_ID_un on customers(CUST_ID); 创建: Bitmap Join Indexes create bitmap index sales_cust_gender_bjix on sales(customers.c

  • 详解mysql建立索引的使用办法及优缺点分析

    前言 索引(index)是帮助MySQL高效获取数据的数据结构. 它对于高性能非常关键,但人们通常会忘记或误解它. 索引在数据越大的时候越重要.规模小.负载轻的数据库即使没有索引,也能有好的性能, 但是当数据增加的时候,性能就会下降很快. 为什么要创建索引呢? 这是因为,创建索引可以大大提高系统的性能. 第一.通过创建唯一性索引,可以保证数据库表中每一行数据的唯一性. 第二.可以大大加快数据的检索速度,这也是创建索引的最主要的原因. 第三.可以加速表和表之间的连接,特别是在实现数据的参考完整性方

  • MySQL建立唯一索引实现插入重复自动更新

    前言 在我们往数据库插入数据的时候,需要判断某个字段是否存在,如果存在则执行更新操作,如果不存在则执行插入操作,如果每次首先查询一次判断是否存在,再执行插入或者更新操作,就十分不方便.下面给大家分享个方法,方便大家实现这一功能,下面来一起看看吧. ON DUPLICATE KEY UPDATE 这个时候可以给这个字段(或者几个字段)建立唯一索引,同时使用以下 sql 语句进行插入或更新操作: INSERT INTO table (id, user_id, token) VALUES (NULL,

  • MySQL查看、创建和删除索引的方法

    本文实例讲述了MySQL查看.创建和删除索引的方法.分享给大家供大家参考.具体如下: 1.索引作用 在索引列上,除了上面提到的有序查找之外,数据库利用各种各样的快速定位技术,能够大大提高查询效率.特别是当数据量非常大,查询涉及多个表时,使用索引往往能使查询速度加快成千上万倍. 例如,有3个未索引的表t1.t2.t3,分别只包含列c1.c2.c3,每个表分别含有1000行数据组成,指为1-1000的数值,查找对应值相等行的查询如下所示. SELECT c1,c2,c3 FROM t1,t2,t3

  • mysql 中存在null和空时创建唯一索引的方法

    好多情况下数据库默认值都有null,但是经过程序处理很多时候会出现,数据库值为空而不是null的情况.此时创建唯一索引时要注意了,此时数据库会把空作为多个重复值,而创建索引失败,示例如下: 步骤1: mysql> select phone ,count(1) from User group by phone; +-----------------+----------+ | phone | count(1) | +-----------------+----------+ | NULL | 70

  • MySQL创建全文索引分享

    使用索引时数据库性能优化的必备技能之一.在MySql数据库中,有四种索引:聚焦索引(主键索引).普通索引.唯一索引以及我们这里将要介绍的全文索引(FUNLLTEXT INDEX). 全文索引(也称全文检索)是目前搜索引擎使用的一种关键技术.它能够利用[分词技术]等多种算法智能分析出文本文字中关键词的频率和重要性,然后按照一定的算法规则智能地筛选出我们想要的搜索结果. 在MySql中,创建全文索引相对比较简单.例如:我们有一个文章表(article),其中有主键ID(id).文章标题(title)

  • 什么情况下需要创建MySQL索引?

    索引可以提高数据的检索效率,也可以降低数据库的IO成本,并且索引还可以降低数据库的排序成本.排序分组操作主要消耗的就是CPU资源和内存,所以能够在排序分组操作中好好的利用索引将会极大地降低CPU资源的消耗. 如何判定是否需要创建索引? 1.较频繁地作为查询条件的字段 这个都知道.什么是教频繁呢?分析你执行的所有SQL语句.最好将他们一个个都列出来.然后分析,发现其中有些字段在大部分的SQL语句查询时候都会用到,那么就果断为他建立索引. 2.唯一性太差的字段不适合建立索引 什么是唯一性太差的字段.

  • MySQL下使用Inplace和Online方式创建索引的教程

    MySQL各版本,对于add Index的处理方式是不同的,主要有三种: (1)Copy Table方式 这是InnoDB最早支持的创建索引的方式.顾名思义,创建索引是通过临时表拷贝的方式实现的. 新建一个带有新索引的临时表,将原表数据全部拷贝到临时表,然后Rename,完成创建索引的操作. 这个方式创建索引,创建过程中,原表是可读的.但是会消耗一倍的存储空间. (2)Inplace方式 这是原生MySQL 5.5,以及innodb_plugin中提供的创建索引的方式.所谓Inplace,也就是

  • 怎样正确创建MySQL索引的方法详解

    索引类似大学图书馆建书目索引,可以提高数据检索的效率,降低数据库的IO成本.MySQL在300万条记录左右性能开始逐渐下降,虽然官方文档说500~800w记录,所以大数据量建立索引是非常有必要的.MySQL提供了Explain,用于显示SQL执行的详细信息,可以进行索引的优化. 什么是索引? MySQL官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构.我们可以简单理解为:快速查找排好序的一种数据结构.Mysql索引主要有两种结构:B+Tree索引和Hash索引.我们平

随机推荐