news 2026/5/28 9:33:25

MyBatis批量插入从5分钟优化到3秒,我做了这3件事

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
MyBatis批量插入从5分钟优化到3秒,我做了这3件事

上周接了个数据迁移的活,要把10万条数据从老系统导入新系统。

写了个简单的批量插入,跑起来一看——5分钟

领导说太慢了,能不能快点?

折腾了一下午,最后优化到3秒,记录一下过程。


最初的代码(5分钟)

最开始写的很简单,foreach循环插入:

// 方式1:循环单条插入(最慢)for(Useruser:userList){userMapper.insert(user);}

10万条数据,每条都要走一次网络请求、一次SQL解析、一次事务提交。

算一下:假设每条插入需要3ms,10万条就是300秒 = 5分钟。

这是最蠢的写法,但我见过很多项目都这么写。


第一次优化:批量SQL(30秒)

把循环插入改成批量SQL:

<!-- Mapper.xml --><insertid="batchInsert">INSERT INTO user (name, age, email) VALUES<foreachcollection="list"item="item"separator=",">(#{item.name}, #{item.age}, #{item.email})</foreach></insert>
// 分批插入,每批1000条intbatchSize=1000;for(inti=0;i<userList.size();i+=batchSize){intend=Math.min(i+batchSize,userList.size());List<User>batch=userList.subList(i,end);userMapper.batchInsert(batch);}

从5分钟降到30秒,提升10倍。

原理:一条SQL插入多条数据,减少网络往返次数。

但还有问题:30秒还是太慢。


第二次优化:JDBC批处理(8秒)

MySQL有个参数叫rewriteBatchedStatements,开启后可以把多条INSERT合并成一条。

第一步:修改数据库连接URL

jdbc:mysql://localhost:3306/test?rewriteBatchedStatements=true

第二步:使用MyBatis的批处理模式

@AutowiredprivateSqlSessionFactorysqlSessionFactory;publicvoidbatchInsertWithExecutor(List<User>userList){try(SqlSessionsqlSession=sqlSessionFactory.openSession(ExecutorType.BATCH)){UserMappermapper=sqlSession.getMapper(UserMapper.class);intbatchSize=1000;for(inti=0;i<userList.size();i++){mapper.insert(userList.get(i));if((i+1)%batchSize==0){sqlSession.flushStatements();sqlSession.clearCache();}}sqlSession.flushStatements();sqlSession.commit();}}

从30秒降到8秒

原理ExecutorType.BATCH模式下,MyBatis会缓存SQL,最后一次性发送给数据库执行。配合rewriteBatchedStatements=true,MySQL驱动会把多条INSERT合并。


第三次优化:多线程并行(3秒)

8秒还是不够快,上多线程:

publicvoidparallelBatchInsert(List<User>userList){intthreadCount=4;// 根据数据库连接池大小调整intbatchSize=userList.size()/threadCount;ExecutorServiceexecutor=Executors.newFixedThreadPool(threadCount);List<Future<?>>futures=newArrayList<>();for(inti=0;i<threadCount;i++){intstart=i*batchSize;intend=(i==threadCount-1)?userList.size():(i+1)*batchSize;List<User>subList=userList.subList(start,end);futures.add(executor.submit(()->{batchInsertWithExecutor(subList);}));}// 等待所有任务完成for(Future<?>future:futures){try{future.get();}catch(Exceptione){thrownewRuntimeException(e);}}executor.shutdown();}

从8秒降到3秒

注意事项

  1. 线程数不要超过数据库连接池大小
  2. 如果需要事务一致性,这个方案不适用
  3. 要考虑主键冲突的问题

优化效果对比

方案耗时提升倍数
循环单条插入300秒基准
批量SQL30秒10倍
JDBC批处理8秒37倍
多线程并行3秒100倍

踩过的坑

坑1:foreach拼接SQL过长

<foreachcollection="list"item="item"separator=",">

如果一次插入太多条,SQL会非常长,可能超过max_allowed_packet限制。

解决:分批插入,每批500-1000条。

坑2:rewriteBatchedStatements不生效

检查几个点:

  1. URL参数是否正确:rewriteBatchedStatements=true
  2. 是否使用了ExecutorType.BATCH
  3. MySQL驱动版本是否太旧

坑3:自增主键返回问题

批量插入时想获取自增主键:

<insertid="batchInsert"useGeneratedKeys="true"keyProperty="id">

注意rewriteBatchedStatements=true时,自增主键返回可能有问题,需要升级MySQL驱动到8.0.17+。

坑4:内存溢出

10万条数据一次性加载到内存,可能OOM。

解决:分页读取 + 分批插入。

intpageSize=10000;inttotal=countTotal();for(inti=0;i<total;i+=pageSize){List<User>page=selectByPage(i,pageSize);batchInsertWithExecutor(page);}

最终方案代码

@ServicepublicclassBatchInsertService{@AutowiredprivateSqlSessionFactorysqlSessionFactory;/** * 高性能批量插入 * 10万条数据约3秒 */publicvoidhighPerformanceBatchInsert(List<User>userList){if(userList==null||userList.isEmpty()){return;}intthreadCount=Math.min(4,Runtime.getRuntime().availableProcessors());intbatchSize=(int)Math.ceil((double)userList.size()/threadCount);ExecutorServiceexecutor=Executors.newFixedThreadPool(threadCount);CountDownLatchlatch=newCountDownLatch(threadCount);for(inti=0;i<threadCount;i++){intstart=i*batchSize;intend=Math.min((i+1)*batchSize,userList.size());if(start>=userList.size()){latch.countDown();continue;}List<User>subList=newArrayList<>(userList.subList(start,end));executor.submit(()->{try{doBatchInsert(subList);}finally{latch.countDown();}});}try{latch.await();}catch(InterruptedExceptione){Thread.currentThread().interrupt();}executor.shutdown();}privatevoiddoBatchInsert(List<User>userList){try(SqlSessionsqlSession=sqlSessionFactory.openSession(ExecutorType.BATCH,false)){UserMappermapper=sqlSession.getMapper(UserMapper.class);for(inti=0;i<userList.size();i++){mapper.insert(userList.get(i));if((i+1)%1000==0){sqlSession.flushStatements();sqlSession.clearCache();}}sqlSession.flushStatements();sqlSession.commit();}}}

总结

优化点关键配置
批量SQLforeach拼接,分批1000条
JDBC批处理rewriteBatchedStatements=true+ExecutorType.BATCH
多线程线程数 ≤ 连接池大小

核心原则:减少网络往返 + 减少事务次数 + 并行处理。


有其他批量操作的优化经验,欢迎评论区交流~

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/27 21:56:48

2025 年 IT 转行选什么?网络安全为何是首选方向?

2025年IT转行就业为什么首先要选网络安全&#xff1f; 记得曾经有人说过这样一个俗语&#xff1a;三百六十行&#xff0c;行行转IT。或许听到这个话的时候会觉得是一句玩笑话&#xff0c;但是浏览到网络上一些关于就业的文章&#xff0c;就能够明白这句话的真正意义所在。随着…

作者头像 李华
网站建设 2026/5/26 6:11:59

小白必看 SQL 注入教程:详细图解 + 基础原理,核心逻辑一看就懂

一、Sql注入简介 Sql 注入攻击是通过将恶意的 Sql 查询或添加语句插入到应用的输入参数中&#xff0c;再在后台 Sql 服务器上解析执行进行的攻击&#xff0c;它目前黑客对数据库进行攻击的最常用手段之一。 二、Web 程序三层架构 三层架构(3-tier architecture) 通常意义上就…

作者头像 李华
网站建设 2026/5/25 21:06:31

【ACWing】153. 双栈排序

题目地址&#xff1a; https://www.acwing.com/problem/content/description/155/ Tom最近在研究一个有趣的排序问题。通过 2 2 2个栈S1和S2&#xff0c;Tom希望借助以下 4 4 4种操作实现将输入序列升序排序。 操作a&#xff1a;如果输入序列不为空&#xff0c;将第一个元素…

作者头像 李华
网站建设 2026/5/26 6:11:59

大数据架构自动化运维:从部署到扩缩容

大数据架构自动化运维&#xff1a;从部署到扩缩容关键词&#xff1a;大数据运维、自动化部署、弹性扩缩容、监控告警、AIOps摘要&#xff1a;本文从“开一家永远不打烊的智能餐厅”的生活场景切入&#xff0c;用通俗易懂的语言讲解大数据架构自动化运维的核心逻辑。我们将一步一…

作者头像 李华
网站建设 2026/5/27 4:29:41

位运算求解八皇后问题:极致优雅的性能优化之道

八皇后问题是计算机科学中的经典回溯算法案例&#xff0c;但在大规模棋盘时性能瓶颈明显。今天我们来介绍一种高效优雅的位运算解法&#xff0c;它不仅能大幅提升性能&#xff0c;还能让代码更加简洁清晰。一、位运算基础&#xff1a;八皇后必备的位操作技巧在深入八皇后问题之…

作者头像 李华
网站建设 2026/5/28 8:25:00

34、Shell编程中的流程控制与位置参数使用

Shell编程中的流程控制与位置参数使用 1. 流程控制之case语句 在编程里,流程控制是非常重要的一部分。之前在处理用户选择时,我们会用一系列 if 命令来判断用户选了哪个选项。不过,这种结构在程序里经常出现,所以很多编程语言(像shell)都提供了用于多选择决策的流程控…

作者头像 李华