重学c#系列——linq(3) [二十九]
前言
继续介绍一些复杂的linq。
正文
groupjoin 这个函数:
有department
public class Deployment
{
public string Id { get; set; }
public Deployment(string id)
{
Id = id;
}
}
有Employee:
public class Employee
{
public string DepartmentId { get; set; }
public string Name { get; set; }
public Employee(string name, string deploymentId)
{
Name = name;
DepartmentId = deploymentId;
}
}
现在要实现Deployment和Employee,一对多的关系:
List<Deployment> a = new List<Deployment>()
{
new Deployment("1"),
new Deployment("2"),
};
List<Employee> e = new List<Employee>()
{
new Employee("张三","1"),
new Employee("李四","1"),
new Employee("王五","2"),
};
如果我们使用join的话,那么就是:
Deployment("1") Employee("张三","1")
Deployment("1") Employee("李四","1")
Deployment("2") Employee("王五","2")
就是这种平铺的关系。然后再使用group by。
Deployment("1")
Employee("张三","1")
Employee("李四","1")
Deployment("2")
Employee("王五","2")
现在有一个函数可以直接到达这种效果,那么就是groupjoin:
static void Main(string[] args)
{
List<Deployment> a = new List<Deployment>()
{
new Deployment("1"),
new Deployment("2"),
};
List<Employee> e = new List<Employee>()
{
new Employee("张三","1"),
new Employee("李四","1"),
new Employee("王五","2"),
};
var c = a.GroupJoin(e, deployment => deployment.Id,
employee => employee.DepartmentId,
(department, exployees) =>(department.Id, exployees)
);
Console.ReadKey();
}
其实可以看到这个exployees,最终运行时是一个Igroup类型,这和join还有group by不同之处。
然后这里写一下join和group by的。
static void Main(string[] args)
{
List<Deployment> a = new List<Deployment>()
{
new Deployment("1"),
new Deployment("2"),
new Deployment("3")
};
List<Employee> e = new List<Employee>()
{
new Employee("张三","1"),
new Employee("李四","1"),
new Employee("王五","2"),
};
var f = from a1 in a
join e1 in e on a1.Id equals e1.DepartmentId into temps
from tt in temps.DefaultIfEmpty()
select (a1.Id, (a1.Id, tt));
var d = from f1 in f
group f1 by f1.Id;
Console.ReadKey();
}
这里要说明的就是groupjoin 是一个左连接。
上面用的是linq的查询表达式,因为join 方法其实是inner join。
对于表达式来说其实最终还是生成方法而已,IL 来说没有表达式这回事,可以理解为c#的语法糖。
看下如果上述的linq用方法来怎么写吧。
其实还是用的是groupjoin:
这里可以看出,其实上述这个linq表达式就是groupjoin 然后用selectmany拆开,然后在用group再聚合。。
如果你只需要获取每个部门下的员工,用groupjoin 效率是更高的。
当然这里主要是说明linq 的表达式最终都是方法,语法糖而已。表达式是为了让我们更加清晰的去描述。
如果写一些复杂的linq,那么最好去用linq表达式。通过如果是groupjoin 就能实现的,就没必要去使用,这可能效率更低。
这里提到了selectmany,那么就讲述一下selectmany。 group by 是聚合,那么selectmany就是拆分。
public class BasketballTeam
{
public string Name { get; set; }
public string[] TeamMember;
}
static void Main(string[] args)
{
List<BasketballTeam> list = new List<BasketballTeam>();
BasketballTeam basketballTeam = new BasketballTeam();
basketballTeam.Name = "无敌球队";
basketballTeam.TeamMember = new string[] { "张三", "李四", "王五" };
BasketballTeam basketballTeam1 = new BasketballTeam();
basketballTeam1.Name = "小新球团";
basketballTeam1.TeamMember = new string[] { "张嘛子", "李老帽", "王七三" };
list.Add(basketballTeam);
list.Add(basketballTeam1);
var a = list.SelectMany(u=> u.TeamMember, (u,s)=> u.Name + " " + s);
foreach (var item in a)
{
Console.WriteLine(item);
}
Console.ReadKey();
}
selectMany 就是用来处理集合的集合的,是一个展开过程。
上面代码是遍历一组球队的全部成员。
有兴趣可以去看下代码,其实都能猜到,就是两个foreach 循环的封装。
下面介绍一下c# 匿名类型对linq使用:
如果临时使用,那么可以使用匿名类型。
匿名类型其实不是说真的匿名,其实是编译的时候会生成一个类。
如果两者完全一样,那么将会生成一个类,如果只要有一点结构不同,那么会生成两个类。
因为上面一致,所以赋值。
顺序不一致,依然生成不同的类。
不过现在元组替代了匿名类型,因为元组在方法外部也可以使用。
然后值得注意的是匿名类型是引用类型,而元组是值类型,如果经常拷贝且内存超过128位就用匿名,否则就是元组。
其实不用纠结元组和匿名,就是元组的功能比匿名强,但是因为元组是值类型,如果经常赋值拷贝的话那么肯定是引用类型更好,所以匿名类型这时候才是用武之地。
结
下一节查询表达式,也是linq的终章。后面一张就是异步(并行和并发),这个考虑在汇编系列之后,因为介绍task实现原理,需要用到il,用到il就需要一些汇编知识。