基本概念
LINQ,語言級集成查詢(Language INtegrated Query)
經過了最近 20 年,面向對象編程技術( object-oriented (OO) programming technologies )在工業(yè)領域的應用已經進入了一個穩(wěn)定的發(fā)展階段。程序員現在都已經認同像 類(classes)、對象(objects)、方法(methods)這樣的語言特性??疾飕F在和下一代的技術,一個新的編程技術的重大挑戰(zhàn)開始呈現出來,即面向對象技術誕生以來并沒有解決降低訪問和整合信息數據( accessing and integrating information )的復雜度的問題。其中兩個最主要訪問的數據源與數據庫( database )和 XML 相關。
LINQ 提供了一條更常規(guī)的途徑即給 .Net Framework 添加一些可以應用于所有信息源( all sources of information )的具有多種用途( general-purpose )的語法查詢特性( query facilities ),這是比向開發(fā)語言和運行時( runtime )添加一些關系數據( relational )特性或者類似 XML 特性( XML-specific )更好的方式。這些語法特性就叫做 .NET Language Integrated Query (LINQ) 。
包含 DLinq 和 XLinq
基礎知識 1. LINQ的讀法:(1)lin k (2)lin q
2. LINQ的關鍵詞:from, select, in, where, group by, order by …
3. LINQ的注意點:必須以select或者是group by 結束。
4. LINQ的語義:
from 臨時變量 in 集合對象或數據庫對象
where 條件表達式
[order by條件]
select 臨時變量中被查詢的值
[group by 條件]
LINQ的查詢返回值的類型是臨時變量的類型,可能是一個對象也可能是一個集合。并且LINQ的查詢表達式是在最近一次創(chuàng)建對象時才被編譯的。LINQ的查詢一般跟var關鍵字一起聯(lián)用 (什么是var?匿名對象) 。
5. LINQ的全稱:Language-Integrated Query
6. LINQ的分類:LINQ to Object, LINQ to XML, LINQ to SQL, LINQ to
ADO.NET
語法實例 C#3.0 LINQ 查詢語法
首先來看一個很簡單的LINQ查詢例子,查詢一個int 數組中小于5的數字,并按照大小順序排列:
class Program
{
static void Main(string[] args)
{
int[] arr = new int[] { 8, 5, 89, 3, 56, 4, 1, 58 };
var m = from n in arr where n < 5 orderby n select n;
foreach (var n in m)
{
Console.WriteLine(n);
}
Console.ReadLine();
}
}
上述代碼除了LINQ查詢語法外,其他都是我們所熟悉的語法,而LINQ查詢語法跟SQL查詢語法很相似,除了先后順序。
Q:為何 LINQ 查詢語法是以 from 關鍵字開頭的,而不是以 select 關鍵字開頭的?select 開頭這種寫法跟SQL的寫法更接近,更易懂呀?
A:簡單來說,為了IDE的智能感知(Intelisence)這個功能,select 關鍵字放在后面了。
編程語言以 select 開頭寫LINQ查詢語法不是沒出現過,你如果使用過2005年的VB9 CTP 版本,那時候VB9的LINQ查詢語法就是 select 關鍵字在前面,但是 select 關鍵字在前面,在做智能感知(Intelisence)時候就很頭大。經過微軟IDE組的權衡,確定了把 from 關鍵字放在最前面。
比如:你看 http://blog.joycode.com/saucer/archive/2005/09/16/63513.aspx 這篇博客,那時候 VB9 LINQ的查詢語法還是 select 參數在最前面。不過后來 VB9 測試版改成了跟 C# 一樣的做法, from 關鍵字放在最前面了。
更詳細的解釋,來自裝配腦袋
假設你要書寫這樣的代碼:Select p.Name, p.Age From p In persons Where xxx ,代碼是一個個字符輸入的。
我們在寫到 p in persons 之前,p 的類型是無法推測的,所以寫 Select p. 的時候,Name之類的屬性不會彈出智能提示來。
這樣就需要先去寫 From 這句,再回來寫 Select。
微軟IDE組經過反復考慮決定,還不如就把 Select 寫到后面了。于是編程語言中的寫法就確定這樣來寫了。
VB9 的這個變化可以參看這篇博客:
Select/From vs. From/Select revisited...
我們再來看一個稍稍復雜的LINQ查詢:
在我們羅列的語言字符串中,我們希望按照字符長短,分類羅列出來,實現代碼如下:
static void Main(string[] args)
{
string [] languages = {"Java","C#","C++","Delphi","VB.net","VC.net","C++ Builder","Kylix","Perl","Python"};
var query = from item in languages
orderby item
group item by item.Length into lengthGroups
orderby lengthGroups.Key descending
select lengthGroups;
foreach (var item in query)
{
Console.WriteLine("strings of length {0}",item.Key);
foreach (var val in item)
{
Console.WriteLine(val);
}
}
Console.ReadLine();
}
其中的 into 關鍵字表示 將前一個查詢的結果視為后續(xù)查詢的生成器,這里是跟 group by 一起使用的。
LINQ中的Group by不要跟 SQL 中的Group by 混淆,SQL 由于是二維結構,Group by 的一些邏輯受二維結構的約束,無法象 LINQ 中的Group by 這么靈活。
Linq的內部執(zhí)行原理淺析 LINQ(Language Integrated Query)是Visual Studio 2008中的領軍人物。借助于LINQ技術,我們可以使用一種類似SQL的語法來查詢任何形式的數據。目前為止LINQ所支持的數據源有SQL Server、XML以及內存中的數據集合。開發(fā)人員也可以使用其提供的擴展框架添加更多的數據源,例如MySQL、Amazon甚至是Google Desktop。
一般來講,這類查詢語句的一個重要特點就是可以并行化執(zhí)行。雖然有些情況下并行可能會帶來一些問題,但這種情況非常少見。這樣也就水到渠成地引出了PLINQ這個并行處理的LINQ類庫。
PLINQ原名為Parallel LINQ,支持XML和內存中的數據集合。執(zhí)行于遠程服務器上的查詢語句(例如LINQ to SQL)顯然無法實現這個功能。
將LINQ語句轉換為PLINQ語句極為簡單——只需要在查詢語句中From子句所指定的數據源的最后添加.AsParallel()即可。隨后Where、OrderBy和Select子句將自動改為調用這個并行的LINQ版本。
據MSDN Magazine介紹,PLINQ可以以三種方式執(zhí)行。第一種是管道處理:一個線程用來讀取數據源,而其他的線程則用來處理查詢語句,二者同步進行——雖然這個單一的消費線程可能并不那么容易與多個生產線程同步。不過若是能夠仔細配置好負載平衡的話,仍然會極大地減少內存占用。
第二種模式叫做“stop and go”,用于處理結果集需要被一次返回時(例如調用ToList、ToArray或對結果排序)的情況。在這種模式下,將依次完成各個處理過程,并將結果統(tǒng)一返回給消費線程。這個模式在性能上將優(yōu)于第一種模式,因為它省去了用來保持線程同步所花費的開銷。
最后一種方法叫做“inverted enumeration”。該方法并不需要實現收集到所有的輸出,然后在單一的線程中處理,而是將最終調用的函數通過ForAll擴展傳遞到每個線程中。這是目前為止最快的一種處理模式,不過這需要傳遞到ForAll中的函數是線程安全的,且最好不包含任何lock之類的互斥語句。
若是PLINQ中任意的一個線程拋出異常,那么所有的其他線程將會被終止。若是拋出了多個異常,那么這些異常將被組合成一個MultipleFailuresException類型的異常,但每個異常的調用堆棧仍會被保留。