我们遇到了什么? 我们有这么一个业务场景,就是某供应商会去爬取某些数据,爬到后会发到一个FTP上,然后我们定时去获取这些数据 这个数据有大有小,小的30多M数据量百万级,大的数据量能到数百M上千万数据 然后当这些数据到达的时候,我们需要在有限的时间内把这些数据写入到我们自己的数据库里. 而写入的过程包括先进行一轮数据清洗,按照指定的规则映射到我们自己的数据后在写进去并不是简单无脑的数据来了就batch insert那么简单 原来的实现方案 传统的Sql Server硬抗,DBA叫苦连天,经常投诉…