0

0

mysql如何处理大批量数据导入时的事务提交_通过循环分片减少锁时长

P粉602998670

P粉602998670

发布时间:2026-04-22 00:39:32

|

188人浏览过

|

来源于php中文网

原创

大批量INSERT卡死或超时是因长事务持续持有锁、undo/redo log膨胀及日志刷盘压力大;应分片为1000–5000行/批,每批1–5秒内提交,控制总字节数低于innodb_log_file_size的30%。

mysql如何处理大批量数据导入时的事务提交_通过循环分片减少锁时长

为什么大批量 INSERT 会卡死或超时

MySQL 默认在事务中执行大批量 INSERT 时,会持续持有行锁(或表锁,取决于存储引擎和隔离级别),同时 undo log 和 redo log 持续增长。InnoDB 在单事务中写入超过几万行就可能触发 Lock wait timeout exceededMySQL server has gone away —— 这不是网络问题,而是事务太长、锁未释放、日志刷盘压力大导致的。

用循环分片控制事务大小的关键参数

核心是把 100 万行拆成多个小事务,每批提交一次。重点不是“分多少次”,而是让每批能在 1–5 秒内完成提交,避免锁竞争和主从延迟激增。

  • autocommit=0 必须关闭,否则每次 INSERT 都自动提交,失去分片意义
  • 每批行数建议设为 1000–5000:太小(如 100)会增加网络往返和事务开销;太大(如 20000)仍可能触碰 innodb_log_file_size 限制或锁等待
  • 显式调用 COMMIT 后立即 BEGIN(或 START TRANSACTION),不要依赖隐式开启
  • 如果用 LOAD DATA INFILE,它本身不支持分片,必须先切文件,再循环执行多条 LOAD DATA INFILE

Python + PyMySQL 示例:带异常回滚的分片插入

注意不是简单 for 循环套 execute,要捕获异常并确保事务原子性:

conn.autocommit = False
cursor = conn.cursor()
<p>batch_size = 2000
for i in range(0, len(data_rows), batch_size):
batch = data_rows[i:i + batch_size]
try:
cursor.executemany("INSERT INTO t_user (name, email) VALUES (%s, %s)", batch)
conn.commit()  # 成功才提交
except Exception as e:
conn.rollback()
print(f"batch {i} failed: {e}")
raise  # 或记录后继续下一批,视业务容忍度而定</p>

⚠️ 容易踩的坑:executemany 不保证原子性——某一行失败时,前面成功的行已写入(除非用 INSERT ... ON DUPLICATE KEY UPDATE 或全量事务包裹);所以更安全的做法是手动拼 INSERT INTO ... VALUES (...), (...), (...) 单条语句,再用 execute 执行。

YouClaw
YouClaw

Chat2DB打造的轻量级、开源的个人AI桌面助理智能体。

下载

InnoDB 日志与分片大小的实际约束

分片不能只看行数,还要看单批数据总字节数。因为 innodb_log_file_size 限制了单次事务能写入 redo log 的上限(通常默认 48MB)。如果一批插入包含大量 TEXT / BLOB 字段,2000 行也可能超限,报错 MySQL: Got error 1205 'Deadlock found when trying to get lock' 或直接 crash。

  • SELECT SUM(LENGTH(email) + LENGTH(name)) FROM ... 估算单行平均体积
  • 确保 batch_size × avg_row_bytes < innodb_log_file_size × 0.3(留足缓冲)
  • 线上调大 innodb_log_file_size 需重启,且不能 >512MB(MySQL 5.7+ 允许更大,但恢复时间显著增加)

真正卡住的时候,往往不是语法或连接问题,而是 redo log 写满触发 checkpoint 阻塞,或 long transaction 导致 purge 线程跟不上——这些在 slow log 里看不到,得查 SHOW ENGINE INNODB STATUS 里的 LOGTRANSACTIONS 部分。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

WorkBuddy
WorkBuddy

腾讯云推出的AI原生桌面智能体工作台

通义千问
通义千问

阿里巴巴推出的全能AI助手

Claude
Claude

Anthropic发布的与ChatGPT竞争的聊天机器人

Cursor
Cursor

一个新的IDE,使用AI来帮助您重构、理解、调试和编写代码。

Hermes Agent
Hermes Agent

一位与您共同成长的Agent

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
mysql修改数据表名
mysql修改数据表名

MySQL修改数据表:1、首先查看数据库中所有的表,代码为:‘SHOW TABLES;’;2、修改表名,代码为:‘ALTER TABLE 旧表名 RENAME [TO] 新表名;’。php中文网还提供MySQL的相关下载、相关课程等内容,供大家免费下载使用。

752

2023.06.20

MySQL创建存储过程
MySQL创建存储过程

存储程序可以分为存储过程和函数,MySQL中创建存储过程和函数使用的语句分别为CREATE PROCEDURE和CREATE FUNCTION。使用CALL语句调用存储过程智能用输出变量返回值。函数可以从语句外调用(通过引用函数名),也能返回标量值。存储过程也可以调用其他存储过程。php中文网还提供MySQL创建存储过程的相关下载、相关课程等内容,供大家免费下载使用。

595

2023.06.21

mongodb和mysql的区别
mongodb和mysql的区别

mongodb和mysql的区别:1、数据模型;2、查询语言;3、扩展性和性能;4、可靠性。本专题为大家提供mongodb和mysql的区别的相关的文章、下载、课程内容,供大家免费下载体验。

294

2023.07.18

mysql密码忘了怎么查看
mysql密码忘了怎么查看

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql密码忘了怎么办呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

608

2023.07.19

mysql创建数据库
mysql创建数据库

MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBMS 应用软件之一。那么mysql怎么创建数据库呢?php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

476

2023.07.25

mysql默认事务隔离级别
mysql默认事务隔离级别

MySQL是一种广泛使用的关系型数据库管理系统,它支持事务处理。事务是一组数据库操作,它们作为一个逻辑单元被一起执行。为了保证事务的一致性和隔离性,MySQL提供了不同的事务隔离级别。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

393

2023.08.08

sqlserver和mysql区别
sqlserver和mysql区别

SQL Server和MySQL是两种广泛使用的关系型数据库管理系统。它们具有相似的功能和用途,但在某些方面存在一些显著的区别。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

768

2023.08.11

mysql忘记密码
mysql忘记密码

MySQL是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。那么忘记mysql密码我们该怎么解决呢?php中文网给大家带来了相关的教程以及其他关于mysql的文章,欢迎大家前来学习阅读。

849

2023.08.14

Midjourney AI参数详解_Midjourney AI高级功能教程
Midjourney AI参数详解_Midjourney AI高级功能教程

本教程深度解析Midjourney V8.1核心参数体系,助您从新手进阶为指令大师。内容涵盖构图控制(--ar)、风格化程度(--s)、随机性调节(--chaos)及模型版本(--v)的精准设置。重点讲解“原始模式”(--style raw)还原真实质感,以及“负面提示”(--no)排除干扰元素的实战技巧。通过参数组合调优,实现从随机抽卡到精准控制画面的专业级创作。

1

2026.04.22

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送