深入剖析linq的联接
内联接
代码如下
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四","数学",""}
}
on a[] equals b[]
select new {User=a,Score=b}
结果的结构如下
注意结果里没有a表的“王五”数据,在内联接查询里,内部联接会生成一个结果集,在该结果集中,第一个集合的每个元素对于第二个集合中的每个匹配元素都会出现一次。 如果第一个集合中的元素没有匹配元素,则它不会出现在结果集中。
总结:内联接用“join 数据源 on 条件"语法,会将左表(即写在前面的表)的每一条记录和右表(即写在后面的表)的每一条记录进行比较,如果左表有x条记录,右表有y条记录,比较会有x*y次比较,但最后的结果不会有x*y条,而是在x*y条里过滤出符合on条件的记录,有点类似“笛卡尔积+条件判断”的操作。
上面的内联接可完全改成两个from操作(进行笛卡尔积求值),结果的结构是完全一样的
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
from b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四",""}
}
where a[]==b[]
select new {User=a,Score=b}
写到这,可能会问,那所有的内联接操作都改成几个from表就行,还用得着join on的内联接吗?答案是内联接比单纯对几个表进行笛卡尔积求值“效率高很多”,假设有a,b,c三个表,分别为x,y,z条记录,如果用笛卡尔积算法(linq代码如:from a in tab_a from b in tab_b from c in tab_c where ...... select ....),一共会进行x*y*z次连接操作,并对x*y*z条记录进行where过滤;但如果用内联接(linq代码如:from a in tab_a join b in tab_b on ... join c in tab_c on ... select ....),每一次的内联接会基于上一次的结果来进行下一次的操作,即a表和b表进行x*y次操作后,最后可能只得出w条记录(此时的w可能远小于x*y),然后再对c表进行w*z次操作,两者比较x*y*z可能远大于w*z。如果不是a,b,c三个表,而是更多的表进行联接,效率就差距很大了。
组联接
代码如下:
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四","数学",""}
}
on a[] equals b[] into b_group
select new {User=a,Score=b_group}
结果的结构如下
注意:此时“王五”出现在了结果里,在组联接里,第一个集合的每个元素都会出现在分组联接的结果集中(无论是否在第二个集合中找到关联元素)。 在未找到任何相关元素的情况下,该元素的相关元素序列为空。 因此,结果选择器有权访问第一个集合的每个元素。 这与非分组联接中的结果选择器不同,后者无法访问第一个集合中在第二个集合中没有匹配项的元素。
总结:内联接用“join 数据源 on 条件 into 新数据源"语法,会以左表(即写在前面的表)的每一条记录为一组,分别和右表(即写在后面的表)的每一条记录进行比较,如果左表有x条记录,右表有条记录,比较会有x*y次比较,但结果只有x组,而每一组可能有<=y条>=0条记录。
如果要对上面的代码进行输出操作,会有两次循环操作
var query=from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四","数学",""}
}
on a[] equals b[] into b_group
select new {User=a,Score=b_group}; foreach(var p1 in query){
Console.WriteLine($@"{p1.User[0]}的成绩如下:");
foreach(var p2 in p1.Score){
Console.Write($@"---{p2[1]}-{p2[2]}---");
}
Console.WriteLine();
}
结果输出如下:
张三的成绩如下:
---英语-90------语文-70---
李四的成绩如下:
---数学-100---
王五的成绩如下:
可以发现,单是用组联接其实返回的结果在有些情况下是不方便进行处理的,因为要对每一个组再进行循环才能取到我们最终想要的值,下面介绍用“内联接+组联接”来方便的得到我们想要的值
内联接+组联接
代码如下:
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四","数学",""}
}
on a[] equals b[] into b_group
from b2 in b_group
select new {User=a,Score=b2}
即在组联接后的新表b_group再次联接:from b2 in b_group
结果的结构如下:
如果细心的朋友会注意到现在的结果和最前面“内联接”一节的结果是一样的。
这样的结果结构相比上一节的组联接的结构更容易获取结果内容,不再需要需要两次循环,取值代码如下
foreach(var p1 in query){
Console.WriteLine($@"{p1.User[0]}-{p1.User[1]}-{p1.Score[1]}-{p1.Score[2]}");
}
输出如下:
张三-男-英语-90
张三-男-语文-70
李四-女-数学-100
对代码稍作修改
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四","数学",""}
}
on a[] equals b[] into b_group
from b2 in b_group
select new {User=a,Score=b_group}
只是将
select new {User=a,Score=b2}改成了
select new {User=a,Score=b_group}
结果的结构变成如下
每条结果的结构变成string[]和IGrouping<string,string[]>,不管结果的结构如何,记录里已经没有“王五”的数据。
再改下代码,看看b_group,b2和a的全部结构是怎样的
代码如下:
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四",""}
}
on a[] equals b[] into b_group
from b2 in b_group.DefaultIfEmpty()
select new{User=a, Scores=b_group,Score=b2}
结果的结构如下:
左外联接
代码如下
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四",""}
}
on a[] equals b[] into b_group
from b2 in b_group.DefaultIfEmpty()
select new{User=a, Score=b2}
只是在“内联接+组联接”的代码上做了一点改动,将from b2 in b_group改成了from b2 in b_group.DefaultIfEmpty()
结果如下
代码稍作修改,看看内部所有结构
from a in new List<string[]>{
new string[]{"张三","男"},
new string[]{"李四","女"},
new string[]{"王五","男"}
}
join b in new List<string[]>{
new string[]{"张三","英语",""},
new string[]{"张三","语文",""},
new string[]{"李四",""}
}
on a[] equals b[] into b_group
from b2 in b_group.DefaultIfEmpty()
select new{User=a, Scores=b_group,Score=b2}
结果的结构如下
结构和“内联接+组联接"的结构是完成一样的,只是找不到成绩的“王五”也出现在结果集里。
很多资料只写了怎么用“左联接”,但为什么要这么“别扭”写的原因却没有说明,特别是熟悉sql语句的对这种方式很不理解,觉得太绕了。要理解linq,先要抛开之前sql语句的影响,linq既然是c#里对象的sql语句,那我们就要以对象的方式去思考,微软的目的是为了保证linq to object、linq to sql、linq to xml的语法是一样的。先理解linq to object,至于linq to sql最终生成的sql语句是由linq底层的算法来实现的。的下面用图说明下“组联接”--》“内联接+组联接”--》“左外联接“是怎么生成的
深入剖析linq的联接的更多相关文章
- LINQ查询表达式(4) - LINQ Join联接
内部联接 按照关系数据库的说法,“内部联接”产生一个结果集,对于该结果集内第一个集合中的每个元素,只要在第二个集合中存在一个匹配元素,该元素就会出现一次. 如果第一个集合中的某个元素没有匹配元素,则它 ...
- LINQ系列:Linq to Object联接操作符
联接是指将一个数据源对象与另一个数据源对象进行关联或联合的操作.这两个数据源对象通过一个共同的值或属性进行关联. LINQ的联接操作符将包含可匹配(或相同)关键字的两个或多个数据源中的值进行匹配. L ...
- Linq世界走一走
什么是Linq?它是用来做什么的?怎么用? Linq的优点是不管数据源是什么,都可以统一查询.换言之,它是一种包含一套标准查询操作符的查询语言,可以对多个数据源进行查询 ⑴Linq俗称语言集成查询(L ...
- 认识LINQ的第一步---从查询表达式开始
学习和使用C#已经有2个月了,在这两个月的学习中,深刻体会到,C#这门语言还真不适合编程初学者学习,因为它是吸取了很多其他语言,不仅是面向对象,还包括函数式语言的很多特性,导致它变成特性大爆炸的语言. ...
- LINQ入门与标准查询运算符
LINQ的体系结构 查询表达式的完整语法 一.查询表达式必须以from子句开头,以select 或group子句结束.中间可以使用where,orderby ,join,let和其他子句.具有“延迟计 ...
- .NET LINQ 联接运算
联接运算 将两个数据源“联接”就是将一个数据源中的对象与另一个数据源中共享某个通用特性的对象关联起来. 当查询所面向的数据源相互之间具有无法直接领会的关系时,联接就成为一项重要的运 ...
- LINQ to Sql系列二 简单查询和联接查询
这一篇文章主要总结LINQ to sql的简单查询(单表查询)和联接查询(多表查询) 单表查询 需求是我们要输出TClass表中的结果.使用了from-in-select语句,代码如下: public ...
- NHibernate3剖析:Query篇之NHibernate.Linq增强查询
系列引入 NHibernate3.0剖析系列分别从Configuration篇.Mapping篇.Query篇.Session策略篇.应用篇等方面全面揭示NHibernate3.0新特性和应用及其各种 ...
- linq性能剖析
Orcas(VS2008&Framework3.5)给我们带来了很多令人兴奋的新特性,尤其是LINQ的引进,可以说方便了一大批开发 人员和框架设计人员.过去,当我们使用O/RMapping的一 ...
随机推荐
- struts2封装请求参数
利用struts2框架进行将页面请求的参数封装有三种方法 第一种(不推荐) 就是动作类和bean中结合在一起,这样方法比较简单,但是很混乱. 代码: package com.example.actio ...
- 使用myeclipse2014整合ss2h
使用myeclipse2014整合ssh 新建一个webproject 创建过程中注意选择生成web.Xml 先添加struts2的能力 选择都添加过滤器的选项 Core dojo Dwr spr ...
- mysql hibernate 关于默认值
字段的默认值 写 NOT NULL DEFAULT 0 等等 一直不行, 算了 干脆在创建的时候 在代码set好了 版权声明:本文为博主原创文章,未经博主允许不得转载.
- POJ 2104 K-th Number 主席树(区间第k大)
题目链接: http://poj.org/problem?id=2104 K-th Number Time Limit: 20000MSMemory Limit: 65536K 问题描述 You ar ...
- 第一次spring冲刺第8天
针对这几天出现的问题,我们团队做了用户需求讨论. 1.客户类型:工作者为主,其他类型都适用的计算器软件 2.需求与满足:他们想要的是能使用简单,并且适用于工作上 3.满足度:最好后台可以提供意见反馈, ...
- JAVA之路(二)
学道酬勤,这是第二次学习JAVA,感觉如醍醐灌顶一样,理解很多思想和道理. 本博只是自己对JAVA的一些理解,具体定义以及用法百科里有. 我为什么在博客园内记录自己的学习过程呢,因为我想有人知道我在学 ...
- JAVA 对象序列化——Serializable
1.序列化是干什么的? 简单说就是为了保存在内存中的各种对象的状态(也就是实例变量,不是方法),并且可以把保存的对象状态再读出来.虽然你可以用你自己的各种各样的方法来保存object st ...
- CANOpen学习指南
对于初学者,相对于其他总线的资料来说,在国内CANOpen的资料并不多.而且并不是所有资料都适合初学者看的.这里给出一些建议,对CANOpen感兴趣的,可以参考一下学习的顺序. 前提:需要对CAN总线 ...
- react +MUI checkbox使用
PS:因项目采用MUI,故,在此所讲的checkbox组件为MUI里的checkbox 因checkbox组件里 oncheck函数没法判断复选框是否选中,故,若直接复用且通过state改变check ...
- Scrum 4.0(未完待续)
看板设计: 每日例会时间定于下午放学回到宿舍,地点是在宿舍外的走廊或宿舍里,特殊情况待定: 团队开会照片: 任务认领: 首页设计-------王俊杰 鸡汤版面-------列志华 论“汤”版面---- ...