下面鏈接就是一個(gè)c#寫的網(wǎng)絡(luò)爬蟲,上面是翻譯版 ,下面是英文原版
http://blog.csdn.net/wangkun9999/archive/2007/05/02/1594496.aspx
http://www.codeproject.com/cs/internet/Crawler.asp
另外,爬蟲抓下來(lái)的東西要進(jìn)行分析是必然的了,但c#中好像沒(méi)有HTML解析器,特別是對(duì)那種不太規(guī)范的HTML,這里是一些c#解析HTML的資料。
http://www.codeproject.com/csharp/html2xhtmlcleaner.asp
http://www.pcxy.net/Article/netprogramme/xml/Article_36767.html
http://www.cnblogs.com/dragon/archive/2006/12/06/174946.html
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。