mysql如何处理大批量数据导入时的事务提交_通过循环分片减少锁时长

P粉602998670

发布时间：2026-04-22 00:39:32

188人浏览过

来源于php中文网

原创

大批量INSERT卡死或超时是因长事务持续持有锁、undo/redo log膨胀及日志刷盘压力大；应分片为1000–5000行/批，每批1–5秒内提交，控制总字节数低于innodb_log_file_size的30%。

mysql如何处理大批量数据导入时的事务提交_通过循环分片减少锁时长

为什么大批量 INSERT 会卡死或超时

MySQL 默认在事务中执行大批量 INSERT 时，会持续持有行锁（或表锁，取决于存储引擎和隔离级别），同时 undo log 和 redo log 持续增长。InnoDB 在单事务中写入超过几万行就可能触发 Lock wait timeout exceeded 或 MySQL server has gone away —— 这不是网络问题，而是事务太长、锁未释放、日志刷盘压力大导致的。

用循环分片控制事务大小的关键参数

核心是把 100 万行拆成多个小事务，每批提交一次。重点不是“分多少次”，而是让每批能在 1–5 秒内完成提交，避免锁竞争和主从延迟激增。

autocommit=0 必须关闭，否则每次 INSERT 都自动提交，失去分片意义
每批行数建议设为 1000–5000：太小（如 100）会增加网络往返和事务开销；太大（如 20000）仍可能触碰 innodb_log_file_size 限制或锁等待
显式调用 COMMIT 后立即 BEGIN（或 START TRANSACTION），不要依赖隐式开启
如果用 LOAD DATA INFILE，它本身不支持分片，必须先切文件，再循环执行多条 LOAD DATA INFILE

Python + PyMySQL 示例：带异常回滚的分片插入

注意不是简单 for 循环套 execute，要捕获异常并确保事务原子性：

conn.autocommit = False
cursor = conn.cursor()
<p>batch_size = 2000
for i in range(0, len(data_rows), batch_size):
batch = data_rows[i:i + batch_size]
try:
cursor.executemany("INSERT INTO t_user (name, email) VALUES (%s, %s)", batch)
conn.commit()  # 成功才提交
except Exception as e:
conn.rollback()
print(f"batch {i} failed: {e}")
raise  # 或记录后继续下一批，视业务容忍度而定</p>

⚠️ 容易踩的坑：executemany 不保证原子性——某一行失败时，前面成功的行已写入（除非用 INSERT ... ON DUPLICATE KEY UPDATE 或全量事务包裹）；所以更安全的做法是手动拼 INSERT INTO ... VALUES (...), (...), (...) 单条语句，再用 execute 执行。

YouClaw

Chat2DB打造的轻量级、开源的个人AI桌面助理智能体。

下载

InnoDB 日志与分片大小的实际约束

分片不能只看行数，还要看单批数据总字节数。因为 innodb_log_file_size 限制了单次事务能写入 redo log 的上限（通常默认 48MB）。如果一批插入包含大量 TEXT / BLOB 字段，2000 行也可能超限，报错 MySQL: Got error 1205 'Deadlock found when trying to get lock' 或直接 crash。

用 SELECT SUM(LENGTH(email) + LENGTH(name)) FROM ... 估算单行平均体积
确保 batch_size × avg_row_bytes < innodb_log_file_size × 0.3（留足缓冲）
线上调大 innodb_log_file_size 需重启，且不能 >512MB（MySQL 5.7+ 允许更大，但恢复时间显著增加）

真正卡住的时候，往往不是语法或连接问题，而是 redo log 写满触发 checkpoint 阻塞，或 long transaction 导致 purge 线程跟不上——这些在 slow log 里看不到，得查 SHOW ENGINE INNODB STATUS 里的 LOG 和 TRANSACTIONS 部分。

mysql密码强度插件安装配置_MySQL validate_password组件详解

mysql多版本并发控制MVCC如何实现读写不冲突_ReadView生成算法解析

mysql如何监控日志写入延迟_观察Innodb_os_log_pending_writes状态值

mysql触发器如何处理自增主键冲突_手动干预AUTO_INCREMENT逻辑

mysql怎么用函数统计某个字符出现的次数_通过LENGTH与REPLACE差值计算

相关标签:

mysql mysql 数据库 etl

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：mysql如何快速分析上G的慢查询日志_使用pt-query-digest工具生成性能分析报告下一篇：mysql数据库内存抖动怎么办_调整脏页刷新比例与LRU算法

作者最新文章

ThinkPHP开发中如何快速切换项目框架版本_版本管理最佳实践

2026-04-22 00:29

mysql如何快速分析上G的慢查询日志_使用pt-query-digest工具生成性能分析报告

2026-04-22 00:35

为什么宝塔面板数据库连接池经常溢出_调整PHP连接持久化与数据库限额

2026-04-22 00:37

mysql如何处理大批量数据导入时的事务提交_通过循环分片减少锁时长

2026-04-22 00:39

mysql数据库内存抖动怎么办_调整脏页刷新比例与LRU算法

2026-04-22 00:45

SQL如何解决分组后数据丢失问题_检查LEFT JOIN与GROUP BY顺序

2026-04-22 00:55

ThinkPHP运行报Fatal error: Allowed memory size的内存溢出优化方案

2026-04-22 00:59

为什么PHP 8.1安装后无法解析网页_检查Nginx的fastcgi_pass配置

2026-04-22 01:05

SQL中如何实现移动平均值计算_ROWS BETWEEN滑动窗口设置

2026-04-22 01:17

为什么宝塔面板配置了伪静态依然不生效_排查Nginx主配置文件包含关系

2026-04-22 01:31

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI编程开发 AI聊天问答

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI编程开发 AI大模型

WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

AI办公学习 Agent智能体

通义千问

阿里巴巴推出的全能AI助手

Agent工具 Agent智能体

Claude

Anthropic发布的与ChatGPT竞争的聊天机器人

AI编程开发 AI聊天问答

Cursor

一个新的IDE，使用AI来帮助您重构、理解、调试和编写代码。

AI编程开发应用开发

Hermes Agent

一位与您共同成长的Agent

Agent智能体桌面Agent

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI编程开发 AI文本写作

相关专题

mysql修改数据表名

MySQL修改数据表：1、首先查看数据库中所有的表，代码为：‘SHOW TABLES；’；2、修改表名，代码为：‘ALTER TABLE 旧表名 RENAME [TO] 新表名；’。php中文网还提供MySQL的相关下载、相关课程等内容，供大家免费下载使用。

752

2023.06.20

MySQL创建存储过程

存储程序可以分为存储过程和函数，MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名)，也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容，供大家免费下载使用。

595

2023.06.21

mongodb和mysql的区别

mongodb和mysql的区别：1、数据模型；2、查询语言；3、扩展性和性能；4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容，供大家免费下载体验。

294

2023.07.18

mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

608

2023.07.19

mysql创建数据库

MySQL是一个关系型数据库管理系统，由瑞典MySQL AB 公司开发，属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一，在 WEB 应用方面，MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢？php中文网给大家带来了相关的教程以及文章，欢迎大家前来阅读学习。

476

2023.07.25

mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统，它支持事务处理。事务是一组数据库操作，它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性，MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

393

2023.08.08

sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途，但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章，欢迎大家前来学习阅读。

768

2023.08.11

mysql忘记密码

MySQL是一种关系型数据库管理系统，关系数据库将数据保存在不同的表中，而不是将所有数据放在一个大仓库内，这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢？php中文网给大家带来了相关的教程以及其他关于mysql的文章，欢迎大家前来学习阅读。

849

2023.08.14

Midjourney AI参数详解_Midjourney AI高级功能教程

本教程深度解析Midjourney V8.1核心参数体系，助您从新手进阶为指令大师。内容涵盖构图控制（--ar）、风格化程度（--s）、随机性调节（--chaos）及模型版本（--v）的精准设置。重点讲解“原始模式”（--style raw）还原真实质感，以及“负面提示”（--no）排除干扰元素的实战技巧。通过参数组合调优，实现从随机抽卡到精准控制画面的专业级创作。

2026.04.22

热门下载

网站特效

网站源码

网站素材

前端模板