这段时间在项目中运用Entity Framework作为底层数据交互框架。一个字,爽。不仅提高了开发效率,省了很多代码,而且数据库也规范了很多。按照网上的一些教程初步学习,然后实际运用了,再结合MVC ,开发一个模块的增删改查,那真是一个爽歪歪。但是,随着项目不断完善,数据表越来越多,关联性也越来越复杂,问题也逐渐露出水面。首先最大的问题是数据查询慢。有个影响点是Linq里的Count(),查阅了网上许多资料,都没有好的解决方法。这个问题暂时不说,如果那位大师有良策,还不忘赐教。
影响查询慢主要问题在于数据查询,说白了不了解EF是如何执行sql查询的,什么时候进行sql查询?以什么方式进行sql查询的?
我做了一个demo,以微软的Northwind作为数据库,有个Customers表和Orders表,Orders表里有个字段CustomerID,是Customers表的外键。代码如下:
1 NorthwindEntities db = new NorthwindEntities(); 2 var query = db.Customers.AsEnumerable(); 3 for (int idx = 0; idx < 2; idx++) 4 { 5 var customer = query.ElementAt(idx); 6 var order = customer.Orders.FirstOrDefault(); 7 if (order != null) 8 Console.WriteLine(order.OrderID); 9 }
在跟踪代码时,同时将SQL Server Profiler打开。代码执行到2行,sql跟踪器并没有执行sql语句。当执行第5行时,sql跟踪器有了反应。
sql 是查询了customers表。再往下执行到第6行时,
根据外键customerid 去查询orders订单。如此。每循环一次。数据库就会执行2次查询。如果有查询结果有20条,就会有40次查询,如果关联的表越多。查询的次数就会越多。
系统查询能不慢吗。
解决方法:
1 NorthwindEntities db = new NorthwindEntities(); 2 ////取消EF的延迟加载 3 db.Configuration.LazyLoadingEnabled = false; 4 ////一次性查询出customers和Orders数据,并利用ToList()放入到内存中 5 var query = db.Customers.Include("Orders").ToList(); 6 for (int idx = 0; idx < 2; idx++) 7 { 8 var customer = query.ElementAt(idx); 9 var order = customer.Orders.FirstOrDefault(); 10 if (order != null) 11 Console.WriteLine(order.OrderID); 12 }
取消EF的延迟加载。利用Include()将所需要对象一次性查询出来。并利用ToList()将数据存入内存中。
这是优化后的sql运行跟踪。我们会发现,只实现了一次查询,sql语句用了left join的方式将数据一次性查询出来。每次循环也只会访问内存中。
总结:
从这4行代码中,我们发现
1.AsEnumerable()和 AsQueryable() 是延迟执行,当具体使用对象时才会执行sql;ToList() 在使用时就已经执行,并数据存入内存中。 2.EF 本身默认的是延迟加载,每个关联的查询,每次循环的查询都是要执行数据库的。取消延迟加载,利用Include方法,可以一次性将所有数据查询出来。 以上观点纯属个人经验总结,欢迎各位大鸟发表看法,小菜向大家学习了。