linq 大数据 sql 查询及分页优化

前提：

　　需要nuget PredicateLib 0.0.5；

　　SqlServer 2008R2 (建议安装 64 位)；

　　.net 4.5 或以上；

　　当前电脑配置： I7 4核 3.6GHZ，8G 内存 (办公电脑 ,win10 64位)

描述：

　　在实际项目中我们会遇到多个表关联查询数据，并进行分页操作；当数据量很大的时候如（500万或以上）的时候，分页很吃力，特别还需要一些模糊查询，排序的时候会导致很慢；

　　本文章主要解决分页及多个数据表关系查询速度慢的问题：

解决办法及优化过程：

　　1、通常我们对数据库的优化莫过于索引，储存过程等；

　　2、能使用一条Sql 语句查询的话，不要使用多条语句(学习使用 linq 语法)；

　　3、尽量少使用 in ('.....') 多个值；经测试超过 5万个 in 的时候会提示内存不足异常；

　　4、order 的使用很是奇葩，原本用 order Id(主键)，反而查询非常慢，而且 Cpu 使用一下子 100%，换成别的字段就完全没压力；（暂时无法理解，在出现问题后可尝试改变 order）

　　5、尽量 select 少的字段，在实际中遇到分页的时候，先 select 出 Id，然后在通过 Id 去查询完整数据，会比直接查询完整要快 N 倍；

　　　如通过两条语句查询出大数据的时候：var ids = select top 10 Id from ViewTable；

　　　　　　　　　　　　　　　　　　　　 var datas = select * from ViewTable where Id in (ids);

结合表示式生成分页查询扩展(完美优化)：

　　非常实用的硬代码，在大数据分页的时候性能优越：

　　主要原理跟上面第 5点一样，但优化只通过一次查询出完整数据；

　　缺点: 每页的数据量建议不要太大，比如：每页1万

        /// <summary>

        /// 执行分页

        /// 性能比较好

        /// </summary>

        /// <typeparam name="T">实体类型<peparam>

        /// <param name="source">数据源</param>

        /// <param name="orderBy">排序字符串</param>

        /// <param name="pageIndex">分页索引</param>

        /// <param name="pageSize">分页大小</param>

        /// <param name="idSelector">Id选择器</param>

        /// <returns></returns>

        public static async Task<PageInfo<T>> ToPageAsync<T, TId>(this IQueryable<T> source, string orderBy, int pageIndex, int pageSize, Expression<Func<T, TId>> idSelector)

            where T : class

            where TId : class

        {

            source = source.Where(Predicate.Create(idSelector, null, Operator.NotEqual));

            int total = await source.CountAsync();

            var inc = total % pageSize >  ?  : -;

            var maxPageIndex = (int)Math.Floor((double)total / pageSize) + inc;

            pageIndex = Math.Max(, Math.Min(pageIndex, maxPageIndex));

            var idQuery = source.OrderBy(orderBy).Skip(pageIndex * pageSize).Take(pageSize).Select(idSelector);

            var datas = await source.Join(idQuery, idSelector, item => item, (item, id) => item).OrderBy(orderBy).ToArrayAsync();

            var page = new PageInfo<T>(total, datas) { PageIndex = pageIndex, PageSize = pageSize };

            return page;

        }

linq 大数据 sql 查询及分页优化的更多相关文章

深入MySQL（四）：MySQL的SQL查询语句性能优化概述
关于SQL查询语句的优化,有一些一般的优化步骤,本节就介绍一下通用的优化步骤. 一条查询语句是如何执行的首先,我们如果要明白一条查询语句所运行的过程,这样我们才能针对过程去进行优化. 参考我之前画的 ...
mysql大数据量下的分页
mysql大数据量使用limit分页,随着页码的增大,查询效率越低下. 测试实验 1. 直接用limit start, count分页语句, 也是我程序中用的方法: select * from p ...
《深度访谈：华为开源数据格式 CarbonData 项目，实现大数据即席查询秒级响应》
深度访谈:华为开源数据格式 CarbonData 项目,实现大数据即席查询秒级响应 Tina 阅读数:146012016 年 7 月 13 日 19:00 华为宣布开源了 CarbonData ...
如何提高sql查询性能到达优化程序的目的
1.关于SQL查询效率,100w数据 SQL查询效率 step by step -- setp 1.-- 建表create table t_userinfo(userid int identity(1 ...
大数据量查询容易OOM？试试MySQL流式查询
一.前言程序访问 MySQL 数据库时,当查询出来的数据量特别大时,数据库驱动把加载到的数据全部加载到内存里,就有可能会导致内存溢出(OOM). 其实在 MySQL 数据库中提供了流式查询,允许把符 ...
offset新探索：双管齐下，加速大数据量查询
摘要:随着offset的增加,查询的时长也会越来越长.当offset达到百万级别的时候查询时长通常是业务所不能容忍的. 本文分享自华为云社区<offset新探索:双管齐下,加速大数据量查询> ...
【大数据之数据仓库】GreenPlum优化器对比测试
在< [大数据之数据仓库]选型流水记>一文中有提及,当时没有测试GreenPlum的quicklz压缩算法和ORCA查询优化器,考虑到quicklz压缩算法因为版权问题不会开源(详情请参阅 ...
Impala简介PB级大数据实时查询分析引擎
1.Impala简介 • Cloudera公司推出,提供对HDFS.Hbase数据的高性能.低延迟的交互式SQL查询功能. • 基于Hive使用内存计算,兼顾数据仓库.具有实时.批处理.多并发等优点 ...
开发一个不需要重写成Hive QL的大数据SQL引擎
摘要:开发一款能支持标准数据库SQL的大数据仓库引擎,让那些在Oracle上运行良好的SQL可以直接运行在Hadoop上,而不需要重写成Hive QL. 本文分享自华为云社区< ...

随机推荐

Jenkins 在 Tomcat 运行访问路径设置
问题最近用 Tomcat 搭建了个 Jenkins ,但是访问的时候需要端口加 /jenkins/ 才能进行访问.我们是直接将 Jenkins.war 包放在 webapps下的. 我们想直接通过不 ...
爬取bilibili首页菜单获取li内容
代码: import requests from bs4 import BeautifulSoup def html_save(s): with open('哔哩哔哩.csv','a')as f: f ...
湖南省web应用软件（中慧杯）
湖南省web应用软件写这篇博客已经是比完赛的第四天了,我还记得那天下着小雨.我们早早的到了比赛的现场抽检机器,在比赛前一天我很是激动.我还记得我们从学校,去株洲的时候我们的领导来给我加油,特别是我的 ...
mybatis关联关系映射
1.一对多关联关系 2.多对多关联关系首先先用逆向生成工具生成t_hibernate_order.t_hibernate_order_item t_hibernate_book.t_hibernat ...
易优CMS:volist的基础应用
[基础用法] 名称:volist 功能:数据/记录循环输出标签语法: {eyou:channel type='top'} {eyou:volist name='$field ...
Xcode修改工程文件名字
http://stackoverflow.com/questions/8262613/renaming-xcode-4-project-and-the-actual-folder
剑指offer 12：二进制中1的个数
题目描述输入一个整数,输出该数二进制表示中1的个数.其中负数用补码表示. 解法一:设置标志为flag=1,逐个位移至不同位置,比较是否为1. C++实现 class Solution { publi ...
微服务：Eureka+Zuul+Ribbon+Feign+Hystrix构建微服务架构
原文地址:http://blog.csdn.net/qq_18675693/article/details/53282031 本案例将打架一个微服务框架,参考来源官方参考文档微服务:是什么?网上有一 ...
Python、PyCharm、django环境搭建
本文又名—— 响应式页面——从无到有(一) 事情是这样的,期末小组作业,需要我把大佬们写的页面搞成响应式的,但是我连py都没用过,只好现学…… 文章目录一.前言 1.1 环境介绍 1.2 前期尝试 ...
[20191012]组成rowid.txt
[20191012]组成rowid.txt --//昨天做了拆分rowid的测试,链接http://blog.itpub.net/267265/viewspace-2659613/=>[2019 ...

linq 大数据 sql 查询及分页优化

linq 大数据 sql 查询及分页优化的更多相关文章

随机推荐

热门专题