优秀的编程知识分享平台

网站首页 > 技术文章 正文

最常问的MySQL面试题三——每个开发人员都应该知道

nanyue 2024-08-02 17:54:59 技术文章 5 ℃

上一篇文章介绍了关于MySQL数据库基础题,首先,谢谢大家的持续关注,您的关注是小编最大的动力。本文将介绍MySQL高性能索引。本文篇幅稍长,小编鼓励大家坚持看完,一定会有所收获。

小编计划收集整理的MySQL面试题包括如下知识点或题型:

  • MySQL数据库基础

  • MySQL高性能索引

  • SQL语句

  • MySQL查询优化

  • MySQL高扩展高可用

  • MySQL安全性

为了避免收藏不看,让大家更有耐心看下去,印象更深刻些,小编将分6次分别发布这些内容,本文是其中的第2篇。

首先看一道真题

简单描述MySQL中,索引,主键,唯一索引,联合索引的区别,对数据库的性能有什么影响?

知识点分析

此真题主要考察的是MySQL索引的基础和类型,由此延伸出的知识点还包括如下内容:

  • MySQL索引的创建原则

  • MySQL索引的注意事项

  • MySQL索引的原理

下面我们就来将这些知识一网打尽

索引的基础

索引类似于书籍的目录,要想找到一本数的某个特定主题,需要先查找书的目录,定位对应的页码

存储引擎使用类似的方式进行数据查询,先去索引当中找到对应的值,然后根据匹配的索引找到对应的数据行。

创建索引的语法:

首先创建一个表:create table t1 (id int primary key,username varchar(20),password varchar(20));

创建单个索引的语法:CREATE INDEX 索引名 on 表名(字段名)

索引名一般是:表名_字段名

给id创建索引:CREATE INDEX t1_id on t1(id);

创建联合索引的语法:CREATE INDEX 索引名 on 表名(字段名1,字段名2)

给username和password创建联合索引:CREATE index t1_username_password ON t1(username,password)

其中index还可以替换成unique,primary key,分别代表唯一索引和主键索引

删除索引:DROP INDEX t1_username_password ON t1

索引对性能的影响:

  • 大大减少服务器需要扫描的数据量。

  • 帮助服务器避免排序和临时表。

  • 将随机I/O变顺序I/O。

  • 大大提高查询速度。

  • 降低写的速度(不良影响)。

  • 磁盘占用(不良影响)。

索引的使用场景:

对于非常小的表,大部分情况下全表扫描效率更高。

中到大型表,索引非常有效。

特大型的表,建立和使用索引的代价会随之增大,可以使用分区技术来解决。

索引的类型:

索引很多种类型,是在MySQL的存储引擎实现的。

普通索引:最基本的索引,没有任何约束限制。

唯一索引:和普通索引类似,但是具有唯一性约束。

主键索引:特殊的唯一索引,不允许有空值。

区别:

一个表只能有一个主键索引,但是可以有多个唯一索引。

主键索引一定是唯一索引,唯一索引不是主键索引。

主键可以与外键构成参照完整性约束,防止数据不一致。


联合索引:将多个列组合在一起创建索引,可以覆盖多个列。(也叫复合索引,组合索引)

外键索引:只有InnoDB类型的表才可以使用外键索引,保证数据的一致性、完整性、和实现级联操作(基本不用)。

全文索引:MySQL自带的全文索引只能用于MyISAM,并且只能对英文进行全文检索 (基本不用)

看到这,上面那道真题已经有答案了。

MySQL索引的创建原则

  1. 最适合创建索引的列是出现在WHERE或ON子句中的列,或连接子句中的列而不是出现在SELECT关键字后的列。

  2. 索引列的基数越大,数据区分度越高,索引的效果越好。

  3. 对于字符串进行索引,应该制定一个前缀长度,可以节省大量的索引空间。

  4. 根据情况创建联合索引,联合索引可以提高查询效率。

  5. 避免创建过多的索引,索引会额外占用磁盘空间,降低写操作效率。

  6. 主键尽可能选择较短的数据类型,可以有效减少索引的磁盘占用提高查询效率。

MySQL索引的注意事项

1、联合索引遵循前缀原则

KEY(a,b,c)

WHERE a = 1 AND b = 2 AND c = 3

WHERE a = 1 AND b = 2

WHERE a = 1

以上SQL语句可以用到索引

WHERE b = 2 AND c = 3

WHERE a = 1 AND c = 3

以上SQL语句用不到索引

2、LIKE查询,%不能在前

WHERE name LIKE "%wang%"

以上语句用不到索引,可以用外部的ElasticSearch、Lucene等全文搜索引擎替代。

3、列值为空(NULL)时是可以使用索引的,但MySQL难以优化引用了可空列的查询,它会使索引、索引统计和值更加复杂。可空列需要更多的储存空间,还需要在MySQL内部进行特殊处理。

4、如果MySQL估计使用索引比全表扫描更慢,会放弃使用索引,例如:

表中只有100条数据左右。

对于SQL语句WHERE id > 1 AND id < 100,MySQL会优先考虑全表扫描。

5、如果关键词or前面的条件中的列有索引,后面的没有,所有列的索引都不会被用到。

6、列类型是字符串,查询时一定要给值加引号,否则索引失效,例如:

列name varchar(16),存储了字符串"100"

WHERE name = 100;

以上SQL语句能搜到,但无法用到索引。

MySQL索引的原理

MySQL索引是用一种叫做聚簇索引的数据结构实现的,下面我们就来看一下什么是聚簇索引。

聚簇索引是一种数据存储方式,它实际上是在同一个结构中保存了B+树索引和数据行,InnoDB表是按照聚簇索引组织的(类似于Oracle的索引组织表)。

注:

B+ 树是一种树数据结构,是一个n叉排序树,每个节点通常有多个孩子,一棵B+树包含根节点、内部节点和叶子节点。根节点可能是一个叶子节点,也可能是一个包含两个或两个以上孩子节点的节点。

B+ 树通常用于数据库和操作系统的文件系统中。NTFS, ReiserFS, NSS, XFS, JFS, ReFS 和BFS等文件系统都在使用B+树作为元数据索引。B+ 树的特点是能够保持数据稳定有序,其插入与修改拥有较稳定的对数时间复杂度。B+ 树元素自底向上插入。

InnoDB通过主键聚簇数据,如果没有定义主键,会选择一个唯一的非空索引代替,如果没有这样的索引,会隐式定义个主键作为聚簇索引。

下图形象说明了聚簇索引表(InnoDB)和普通的堆组织表(MyISAM)的区别:

对于普通的堆组织表来说(右图),表数据和索引是分别存储的,主键索引和二级索引存储上没有任何区别。

而对于聚簇索引表来说(左图),表数据是和主键一起存储的,主键索引的叶结点存储行数据,二级索引的叶结点存储行的主键值。

聚簇索引表最大限度地提高了I/O密集型应用的性能,但它也有以下几个限制:

1)插入速度严重依赖于插入顺序,按照主键的顺序插入是最快的方式,否则将会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义一个自增的ID列为主键。

2)更新主键的代价很高,因为将会导致被更新的行移动。因此,对于InnoDB表,我们一般定义主键为不可更新。

3)二级索引访问需要两次索引查找,第一次找到主键值,第二次根据主键值找到行数据。

二级索引的叶节点存储的是主键值,而不是行指针,这是为了减少当出现行移动或数据页分裂时二级索引的维护工作,但会让二级索引占用更多的空间。

解题方法

在一些MySQL索引基础考题中,我们可以轻松的通过索引基础和类型来解决此类问题,对于一些索引创建注意事项方面的考点,我们可以通过索引创建原则和注意事项来解决。


问题1:创建MySQL联合索引应该注意什么?

需遵循前缀原则

问题2:列值为NULL时,查询是否会用到索引?

在MySQL里NULL值的列也是走索引的。当然,如果计划对列进行索引,就要尽量避免把它设置为可空,MySQL难以优化引用了可空列的查询,它会使索引、索引统计和值更加复杂。

问题3:以下语句是否会应用索引:SELECT* FROM users WHERE YEAR(adddate) < 2007;

不会,因为只要列涉及到运算,MySQL就不会使用索引。

问题4:MyISAM索引实现?

答:

MyISAM存储引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址。MyISAM的索引方式也叫做非聚簇索引的,之所以这么称呼是为了与InnoDB的聚簇索引区分。

问题5:MyISAM索引与InnoDB索引的区别?

答:

InnoDB索引是聚簇索引,MyISAM索引是非聚簇索引。

InnoDB的主键索引的叶子节点存储着行数据,因此主键索引非常高效。

MyISAM索引的叶子节点存储的是行数据地址,需要再寻址一次才能得到数据。

InnoDB非主键索引的叶子节点存储的是主键和其他带索引的列数据,因此查询时做到覆盖索引会非常高效。

问题6:以下三条sql 如何建索引,只建一条怎么建?

WHERE a=1 AND b=1

WHERE b=1

WHERE b=1 ORDER BY time DESC

答:

以顺序b,a,time建立联合索引,CREATE INDEX table1_b_a_time ON index_test01(b,a,time)。因为最新MySQL版本会优化WHERE子句后面的列顺序,以匹配联合索引顺序。

感谢您阅读全文,希望本文能够对您的开发或面试有些帮助。

最近发表
标签列表