比想象中更复杂一点的MySQL Slow Query Log

1. 问题概述

在分析 Slow Query Log 时,记录下的SQL语句,明明会对一张表执行全表扫描,可为什么慢日志中的 Rows_sent 、Rows_examined 和表的真实记录数也是不一样,甚至相差N多倍。还有一个细节就是上述的SQL语句,执行多次,在慢日志中记录下多条记录,记录之间Rows_sent 、Rows_examined也差别明显。

这是什么原因导致的呢?

2.举例说明

假如,有一张 product_stock的表,其全表的数据量为80201010,size 约为56G。

对全表进行count(*),在慢日志留下的记录如下

```
# Time:2019-06-06T13:51:22.111111+08:00
# User@Host hehe[hehe] @ localhost [] Id: 868686
# Query_time : 39.112233 Lock_time: 0.000333 Rows_sent 1 Rows_examined: 80201010 
SET timestamp .....;
select count(*) from product_stock;
```

但是系统应用触发的慢SQL记录如下

```
# Time:2019-06-05T14:22:22.111222+08:00
# User@Host uwser[uwser] @ [XX.XX.XX.XX] Id: 667766
# Query_time : 520.662233 Lock_time: 0.000296 Rows_sent 820111 Rows_examined: 820111 
SET timestamp .....;
select * from product_stock where 1=1;
```

说明: where 1=1 ,是系统框架自动补全的,目的是防止SQL语句没有where 条件,这个是无碍的。

确信 整个语句就是全表扫描,问题是为什么它记录下来的扫描行数只是表数据的一小部分?也没有limit限制啊?

3.官方文档对慢日志的定义

The slow query log consists of SQL statements that take more than long_query_time seconds to execute and require at least min_examined_row_limit rows to be examined. The slow query log can be used to find queries that take a long time to execute and are therefore candidates for optimization.

The time to acquire the initial locks is not counted as execution time. mysqld writes a statement to the slow query log after it has been executed and after all locks have been released, so log order might differ from execution order.

• Query_time: duration

The statement execution time in seconds.

• Lock_time: duration

The time to acquire locks in seconds.

• Rows_sent: N

The number of rows sent to the client.

• Rows_examined:

The number of rows examined by the server layer (not counting any processing internal to storage engines).

这些知识对描述的疑惑没有直接帮助。还需我们继续探寻。

4. 猜想

慢日志记录的行数只是整个表的一部分,那会不会是还没执行完?会不会还在执行中被取消了?才导致只是scan其中的部分,返回的行数只是已scan的部分?

例如,如果条件允许的话,整个scan过程需要10分钟,但是执行到1分钟时,因为连接参数设置或则客户端主动取消,才进行了1/10,但是这个SQL语句还是被慢日志记录下来了,虽然它没有执行完整。

5.猜想验证

为了使验证过程简单直接,直接通过本地mysql客户端连接吧。

5.1 执行过程中,直接cancel

当然,cancel的时候,已执行的时间一定要大于自定义的慢查询时间阈值。

截取其中的一条慢日志

```
# Time:2019-06-06T18:36:18.554477+08:00
# User@Host uwser[uwser] @ [XX.XX.XX.XX] Id: 842366
# Query_time : 20.662233 Lock_time: 0.000296 Rows_sent 3691064 Rows_examined: 3691064 
SET timestamp .....;
select * from product_stock
```

cancal取消后,仍然会记录下慢日志,并且只返回已经扫描的数据(80201010中的3691064), 此种情况,验证了猜想是正确的。

5.2 执行中被Kill

当然,被Kill的时候(新打开一个connection去kill即可),已执行的时间一定要大于自定义的慢查询时间阈值。

```
# Time:2019-06-06T19:12:10.553322+08:00
# User@Host uwser[uwser] @ [XX.XX.XX.XX] Id: 842366
# Query_time : 50.662233 Lock_time: 0.000456 Rows_sent 10121006 Rows_examined: 10121006 
SET timestamp .....;
select * from product_stock
```

被KILL后,仍然会记录下慢日志,并且只返回已经扫描的数据(80201010中的10121006), 此种情况,验证了猜想是正确的。

6.结论

1) 被Cancel 或者 被KILL后,SQL语句如果符合慢日志时间,仍然会被记录下来,虽然它没有被完整下执行完;

2)此时的查询时间、扫描行数、返回行数,是截至到被Cancel 或者 被KILL时的 已执行时间、已Rows_sent 行数和 已Rows_examined行数;

3)Query_time、Rows_sent 行数、Rows_examined,可能不是SQL语句已完整执行的结果统计,只是整个SQL过程部分进度的统计,即截至到 被Cancel 或者 被KILL节点的统计;

4)上述情况发生时,执行多次,在慢日志中记录下多条记录,记录之间不同数据不同 是因为SQL受获取执行锁、DB执行时压力情况等因素的不同,导致退出时执行进度不同,各记录间 执行时间、 Rows_sent 、Rows_examined不同也是可以理解的。

文章整理自互联网,只做测试使用。发布者:Lomu,转转请注明出处:https://www.it1024doc.com/6315.html

(0)
LomuLomu
上一篇 2025 年 1 月 14 日 上午7:18
下一篇 2025 年 1 月 14 日 上午8:19

相关推荐

  • 电商用户流失预测新思路:Java大数据与机器学习融合实战

    🌟亲爱的技术爱好者们,诚挚欢迎来到【云端技术社区】!在这个数据驱动的时代,我们致力于打造一个技术交流的优质平台。这里汇聚前沿技术解析与实践经验,期待您的真知灼见,让我们共同探索技术创新的无限可能!🌟全网平台(微信公众号/CSDN/抖音/华为/支付宝/微博):云端技术一、加入【技术精英社群】快速通道1:【云端技术精英圈】快速通道2:【CSDN技术创作营】二、核…

    2025 年 5 月 19 日
    37400
  • 微服务篇-深入了解索引库与文档 CRUD 操作、使用 RestCliet API 操作索引库与文档 CRUD(Java 客户端连接 Elasticsearch 服务端)

    🔥博客主页: 【小扳_-CSDN博客】 ❤感谢大家点赞👍收藏⭐评论✍ 文章目录 1.0 索引库操作 1.1 Mapping 映射属性 1.2 索引库的 CRUD 1.2.1 创建索引和映射 1.2.2 查询索引库 1.2.3 修改索引库 1.2.4 删除索引库 2.0 文档操作 2.1 新增文档 2.2 查询文档 2.3 删除文档 2.4 修改文档 2.4.…

    2025 年 1 月 17 日
    47100
  • 解决IDEA编译时“java: 找不到符号”错误的全面指南

    解决IDEA编译时”java: 找不到符号”错误的全面指南 团队新从Git仓库克隆的项目在IDEA中编译时出现”java: 找不到符号”错误,主要涉及对象getter/setter方法缺失问题。经过一番探索后找到解决方案,在此与大家分享~ 内容导航 问题背景 解决方案汇总 我们的实际解决方式 其他可能情况排查 Lombok插件检查 Lombok依赖确认 JD…

    未分类 2025 年 5 月 12 日
    38500
  • MySQL 面试题

    MySQL 中有哪几种锁? 全局锁、行级锁、自增锁、记录锁、外键锁、间隙锁、表级锁、元数据锁、意向锁、临键锁 MySQL 中有哪些不同的表格? 基础表、临时表、系统表、信息表、性能模式表、分区表、外键表、触发器使用的表、存储过程和函数使用的表 简述在 MySQL 数据库中 MyISAM 和 InnoDB 的区别? 事务支持 InnoDB:支持事务处理,具有提…

    未分类 2025 年 1 月 14 日
    36700
  • 什么是南北向流量和东西向流量?

    在云计算和微服务架构中,南北向流量和东西向流量是两种常见的流量模式。 南北向流量(North-South Traffic) 定义:南北向流量指的是从外部进入系统内部或从系统内部出去的流量,通常是客户端到服务器之间的通信,例如用户通过浏览器或移动应用访问 Web 服务或 API。 特点:这种流量穿过系统的边界,如从外部网络进入内部网络,或者反过来。它通常受到安…

    未分类 2024 年 12 月 31 日
    37600

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信