Mysql批量插入返回Id错乱（原因分析）

在项目中经常会有如下场景：

往数据库中批量插入一批数据后，需要知道哪些插入成功，哪些插入失败了。

这时候往往会有两种思路，一个是在插入之前判断相同的记录是否存在，过滤掉重复的数据；另外一种就是边插入边判断，动态过滤。

第一种方式对于数据量过大的情况并不适用，为了采用第二种方法，我们使用了“Mybatis批量插入返回自增主键”的方式进行处理。

mysql插入操作后返回主键是jdbc的功能，用到的方法是getGeneratedKeys()方法，使用此方法获取自增数据，性能良好，只需要一次交互。

        String sql = "insert IGNORE into user(user_name,password,nick_name,mail) VALUES (?,?,?,?)";

        List<User> userList = Lists.newArrayList();

        userList.add(new User("2","2","2","2"));

        userList.add(new User("3","3","3","3"));

        userList.add(new User("4","4","4","4"));

        try {

            conn = DatabaseUtil.getConnectDB();

            ps = conn.prepareStatement(sql,PreparedStatement.RETURN_GENERATED_KEYS);

            for(User user : userList){

                ps.setString(1, user.getUserName());

                ps.setString(2, user.getPassword());

                ps.setString(3, user.getNickName());

                ps.setString(4, user.getMail());

                ps.addBatch();

            }

            ps.executeBatch();

            ResultSet generatedKeys = ps.getGeneratedKeys();

            ArrayList<Integer> list = Lists.newArrayList();

            while (generatedKeys.next()){

                list.add(generatedKeys.getInt(1));

            }

        } catch (SQLException e) {

            LOGGER.error("error:{}", e.getMessage(), e);

        } finally {

            DatabaseUtil.close(conn, ps, null);

        }

getGeneratedKeys()返回的就是刚刚生成的id。

相应的如果在mybatis中使用的话，只需要在mybatis的mapper文件中设置参数“keyProperty="id" useGeneratedKeys="true"”即可。例如：

   <insert id="insertListSelective" keyColumn="id" keyProperty="id"

            parameterType="Bill" useGeneratedKeys="true">

   </insert>

为了满足我们的需求，我们需要对上述sql进行改造，思路就是在批量插入的时候，如果遇到重复的数据，就忽略，继续插入下一个记录，这时我们采用的是ignore：

MySQL 提供了Ignore 用来避免数据的重复插入.

IGNORE :

若有导致unique key 冲突的记录，则该条记录不会被插入到数据库中.

示例:

INSERT IGNORE INTO `table_name` (`email`, `phone`, `user_id`) VALUES ('test9@163.com', '99999', '9999');

这样当有重复记录就会忽略,执行后返回数字0

但是经过多次测试发现，对象返回的id错乱。

对于上述情况，如果没有重复数据就不会出现问题，于是就猜测是因为ignore的原因，经过查看源码，验证了自己的想法：

public void processBatch(MappedStatement ms, Statement stmt, Collection<Object> parameters) {

    ResultSet rs = null;

    try {

      rs = stmt.getGeneratedKeys();

      final Configuration configuration = ms.getConfiguration();

      final TypeHandlerRegistry typeHandlerRegistry = configuration.getTypeHandlerRegistry();
      //指的是keyProperty="id" 这种参数

      final String[] keyProperties = ms.getKeyProperties();
      //ResultSet的元数据，指的是有关 ResultSet 中列的名称和类型的信息。

      final ResultSetMetaData rsmd = rs.getMetaData();

      TypeHandler<?>[] typeHandlers = null;

      if (keyProperties != null && rsmd.getColumnCount() >= keyProperties.length) {

        for (Object parameter : parameters) {

          // there should be one row for each statement (also one for each parameter)

          if (!rs.next()) {

            break;

          }

          final MetaObject metaParam = configuration.newMetaObject(parameter);

          if (typeHandlers == null) {

            typeHandlers = getTypeHandlers(typeHandlerRegistry, metaParam, keyProperties, rsmd);

          }
          //设置返回的keyProperty（反射）

          populateKeys(rs, metaParam, keyProperties, typeHandlers);

        }

      }

    } catch (Exception e) {

      throw new ExecutorException("Error getting generated key or setting result to parameter object. Cause: " + e, e);

    } finally {

      if (rs != null) {

        try {

          rs.close();

        } catch (Exception e) {

          // ignore

        }

      }

    }

  }

private void populateKeys(ResultSet rs, MetaObject metaParam, String[] keyProperties, TypeHandler<?>[] typeHandlers) throws SQLException {
  for (int i = 0; i < keyProperties.length; i++) {
    String property = keyProperties[i];
    TypeHandler<?> th = typeHandlers[i];
    if (th != null) {
      Object value = th.getResult(rs, i + 1);
      metaParam.setValue(property, value);
    }
  }
}

注意代码中的这一句注释： // there should be one row for each statement (also one for each parameter) ，翻译过来就是每一个元素对应一个ResultSet

分析这段循环代码：

for (Object parameter : parameters) {

          // there should be one row for each statement (also one for each parameter)

          if (!rs.next()) {

            break;

          }

          final MetaObject metaParam = configuration.newMetaObject(parameter);

          if (typeHandlers == null) {

            typeHandlers = getTypeHandlers(typeHandlerRegistry, metaParam, keyProperties, rsmd);

          }

          //设置返回的keyProperty（反射）

          populateKeys(rs, metaParam, keyProperties, typeHandlers);

}

循环遍历要插入的元素，然后通过反射方式设置主键的值，但是注意每次遍历插入元素的时候，ResultSet也在往下遍历，这时候就有问题了：
stmt.getGeneratedKeys()永远返回的都是插入成功的记录的id，如果插入的集合中有几个重复的元素，这时候插入的集合元素与返回的ResultSet就对应不上了，所以才会造成之前的那个问题。

为了避免上述的问题，现在我们采用的方式是单条插入，挨个返回id。

Mysql批量插入返回Id错乱（原因分析）的更多相关文章

MYSQL批量插入数据库实现语句性能分析
假定我们的表结构如下代码如下 CREATE TABLE example ( example_id INT NOT NULL, name VARCHAR( 50 ) NOT NULL, value ...
MYSQL批量插入数据库实现语句性能分析【转】批量插入！程序里面对于数据库插入的功能尽量用【异步处理+批量插入+（事务）】
假定我们的表结构如下代码如下 CREATE TABLE example (example_id INT NOT NULL,name VARCHAR( 50 ) NOT NULL,value VA ...
Mybatis 插入一条或批量插入返回带有自增长主键记录
首先讲一下, 插入一条记录返回主键的 Mybatis 版本要求低点,而批量插入返回带主键的需要升级到3.3.1版本,3.3.0之前的都不行, <dependency> <grou ...
IP访问频率限制不能用数组循环插入多个限制条件原因分析及解决方案
14.IP频率限制不能用数组循环插入多个限制条件原因分析及解决方案: define("RATE_LIMITING_ARR", array('3' => 3, '6' => ...
mybatis oracle mysql 批量插入时的坑爹问题--需谨记
mybatis oracle mysql 批量插入一.oracle的批量插入方式insert into db(id, zgbh, shbzh) select '1', '2', '3' from du ...
mysql批量插入简单测试数据
mysql批量插入简单测试数据 # 参考网址: https://www.2cto.com/database/201703/618280.html 1.mysql创建测试表 CREATE TABLE ` ...
mybatis + mysql 批量插入、删除、更新
mybatis + mysql 批量插入.删除.更新 Student 表结构批量插入 public int insertBatchStudent(List<Student> studen ...
MyBatis之Oracle、Mysql批量插入
Mybatis中Dao层 public interface UsersMapper { public void insertEntitys(List<UserEntity> users); ...
mybatis+mysql批量插入和批量更新、存在及更新
mybatis+mysql批量插入和批量更新一.批量插入批量插入数据使用的sql语句是: insert into table (字段一,字段二,字段三) values(xx,xx,xx),(oo, ...

随机推荐

ELK---- kibana 安装学习
我已经安装了java环境,和elasticsearch.这只有存储,那么管理界面工具什么的,目前还没有,我就是用kibana进行安装. Kibana是一个开源的分析和可视化平台,设计用于和Elasti ...
python--openCV--鼠标事件
import cv2 import numpy as np cv2.namedWindow("new") def drawxxx(event,x,y,flags,param): # ...
window、BOM、 document、 DOM
window: 顾名思义,窗口,浏览器窗口.是Window构造函数的一个实例对象. 它包含浏览器的一些属性和方法,如screen,location,history,setInterval等. // ...
51nod 1086
https://www.cnblogs.com/TnT2333333/p/6879709.html 二进制优化多重背包怎么用二进制优化多重背包,举一个例子就明白了. 如果要放n个苹果,可以将n个苹果 ...
一、docker安装CentOS7
一.安装步骤前提条件 Docker运行在CentOS7上,要求系统64位.系统内核版本为3.10以上. Docker是一个进程,一启动就两个进程,一个服务,一个守护进程.占用资源就非常少,启动速度非 ...
LVM问题-----Insufficient Free Extents for a Logical Volume
Linux LVM学习——Insufficient Free Extents for a Logical Volume 如下所示,在创建LV的时候,偶尔会遇到“Volume group "x ...
TCP SACK 介绍转载
一.SACK选项默认情况下TCP采取的是累积确认机制,这时如果发生了报文乱序到达,接收方只会重复确认最后一个按序到达的报文段,为此发送方的处理只能是重复按序到达接收方的报文段之后的那个报文段,因而它 ...
java学习之路（1）
java中的main()方法: 一.java主类中的主方法形式: public static void main(String[] args){ //TODO } 二.个部分解释: (1).publi ...
什么是文件的BOM头
1.什么是BOM? BOM是用来判断文本文件是哪一种Unicode编码的标记,其本身是一个Unicode字符("\uFEFF"),位于文本文件头部. 在不同的Unicode编码中, ...
AcFun 的视频架构演化实践——阅读心得
视频的核心技术栈 AcFun 弹幕视频网(acfun.tv)是中国最早上线的弹幕视频网站,也是最具影响力的弹幕视频平台.“AcFun”原取意于“AnimeComic Fun”.自2007年6月6日成立 ...

Mysql批量插入返回Id错乱（原因分析）

Mysql批量插入返回Id错乱（原因分析）的更多相关文章

随机推荐

热门专题