优秀的编程知识分享平台

网站首页 > 技术文章正文

MySQL两表关联查询分析和算法解析

nanyue 2024-12-22 19:58:28 技术文章 3 ℃

表关联查询通常有2种算法：NLJ(嵌套循环连接算法)和BNL(基于块的嵌套循环连接算法)

NLJ(嵌套循环连接算法)
一行一行的取第一张表(驱动表)中读取行，然后拿关联字段取第二张表（被驱动表）中取数据，然后取出两张表的结果合集。我们用以下sql为例：t1表2条数据,t2表11行数据
EXPLAIN SELECT t1.* FROM t1 INNER JOIN t2 ON t1.name=t2.name t1和t2表的name都有索引。

通过执行计划可以看出
1、先执行t1表数据，
2、然后拿t1表的每一行数据通过关联字段name去t2表查询，因为我们的t22表字段name建有索引，所以我们每次只会在t2表中扫一行数据。
扫描的总条数，t1表全表查询5条数据+扫描t2表5条数据=10条数据

BNL(基于块的嵌套循环连接算法)
把驱动表的数据读入到join_buffer中，然后扫描被驱动表，把被驱动表的每一行拿出来跟join_buffer中的数据比较。EXPLAIN SELECT t1.* FROM t1 INNER JOIN t2 ON t1.name=t2.name t1和t2表的name都没有索引。

可以看到用的是BNL算法。

1、先把驱动表t1中的5条数据全部读取出来，然后加入到join_buffer(默认256kb)中
2、把t2表中的每一行数据读取出来，然后放到join_buffer中进行比较
3、返回满足条件的数据

使用BNL需要扫描的行数=5+11=16，因为join_buffer中的数据是无序的，所以t2表中每一行数据都需要与join_buffer中的数据比较11*5=55次，所以总的是16次扫描+55次内存中数据判断。
join_buffer默认是256kb，如果表数据放不下，则进行分段放，比如有100行数据，第一次放8行，第二次清空之后放2条。

从上面两个例子可以看出，mysql的查询算法跟两表关联字段是否有索引有关系的。这是什么道理呢？如果我们两个关联的字段没有索引也走NLJ算法呢，会是什么结果呢。我们可以算一下。t1表5条数据，因为t2表关联的查询字段没有索引，所以需要全表扫描，一共需要扫5*11=55次，相比较我们上面使用BNL算法的16次，明显会慢很多。

上一篇： 8种专坑同事的 SQL 写法，性能降低100倍，不来看看?
下一篇：这17组介词短语，初中三年各题型都在考，一定要掌握!

猜你喜欢

2024-12-22 项目案例:Java多线程批量拆分List导入数据库
2024-12-22 8个SQL错误:您是否犯了这些错误? sql有问题
2024-12-22 如何使用 SQL UPDATE 和 DELETE 语句更新或删除表数据
2024-12-22 一文搞懂各种数据库SQL执行计划:MySQL、Oracle等
2024-12-22 MySQL数据库语句数据库mysql基本语句用法
2024-12-22 灵魂一问:为什么ES比MySQL更适合复杂条件搜索?
2024-12-22 MySQL原理简介—11.优化案例介绍 mysql原理详解
2024-12-22 MySQL 表关系、外键、多表查询、子查询
2024-12-22 MYSQL数据库基础和常用语法汇总03篇-数据查询
2024-12-22 微软发布Win10八月累积更新:14项优化和改进，修复142个漏洞

最近发表