今天剛從dream4ever.org知道feed43.com,體驗(yàn)了一把,感覺不錯(cuò),參照了原作者alon的教程,與各位分享。
沒用過RSS的不知道它的好,但是喜歡的網(wǎng)站不支持RSS訂閱怎么辦?用feed43.com就可以了,把web頁面轉(zhuǎn)換成RSS feed。
轉(zhuǎn)換成RSS可以方便的通過RSS訂閱通知我一個(gè)原本不支持RSS的站點(diǎn),更方便更快捷。
這里我以http://www.buzzc.com/blogs/作為例子
登陸feed43.com ,選擇Create your own feed進(jìn)入
Step 1. Specify source page address (URL)
選擇你想轉(zhuǎn)換的Web頁面地址,然后Reload后生成頁面代碼
Address: http://www.eve-online.com.cn/news/index.htm
Encoding: UTF-8
注意:在輸入Address后點(diǎn)Reload按鈕,如果下面的Page Source不顯示亂碼,那么Encoding不指定也可以。一般默認(rèn)為gb2312,自己可以通過察看欲轉(zhuǎn)換頁面的源代碼的開頭處,<meta ... charset=gb2312">
Step 2. Define extraction rules
定義模板規(guī)則,然后Extract后生成抓到的數(shù)據(jù)
Global Search Pattern: {%}
Item (repeatable) Search Pattern*: <liclass="newsitem-s"><h3><ahref='{%}'>{%}</a></h3><pclass="postbyline">{%}</p>{%}[<ahref='{%}'>全文</a>]</li>
重點(diǎn)在于Search Pattern的填寫,可以觀察上面生成的頁面代碼找到規(guī)律,我們發(fā)現(xiàn)每一條標(biāo)題的代碼都是類似如下的。
<liclass="newsitem-s"><h3><ahref='地址'>標(biāo)題</a></h3><pclass="postbyline">內(nèi)容[<a href='地址'>全文</a>]</li>
只要把內(nèi)容部分用{%}替代即可。 Extract后生成的數(shù)據(jù)如下:
Item 1
{%1} = http://feeds.feedburner.com/PlayinWithIt?m=1380
{%2} = 出租車司機(jī)倪亞四
{%3} = 發(fā)表于 3 小時(shí) 之前
{%4} = 你愿不愿意相信 ...
{%5} = http://feeds.feedburner.com/PlayinWithIt?m=1380
Item 2
...
我們可以看到模板中定義的{%}會(huì)自動(dòng)換成{%1}{%2}{%3}
Step 3. Define output format
利用上面生成的{%1}{%2}{%3}...來定義輸出的格式
RSS feed properties
Feed Title: buzzc.com-BLOG
Feed Link: http://www.buzzc.com/blogs/
Feed Description: 匯集最熱門blogs
RSS item properties
Item Title Template*: {%2}-{%3}
Item Link Template*: {%1}
Item Content Template*: {%4}
這里我們把{%2}設(shè)定為標(biāo)題,{%1}設(shè)定為鏈接,{%3}設(shè)定為時(shí)間,{%4}設(shè)定為內(nèi)容,點(diǎn)擊Preview預(yù)覽。
Step 4. Get your RSS feed
最后生成RSS Feed地址:http://feed43.com/8111237031053827.xml,然后就可以用各類RSS閱讀器(例如GreatNews)訂閱訪問了。
最后對(duì)其進(jìn)行處理,需要為注冊用戶:
Change file name of this feed to make it more user-friendly--修改RSS Feed的地址名稱;
Change feed edit password [?]--設(shè)定密碼
Make this feed private [?]--在個(gè)人欄目里顯示 Feed43默認(rèn)不需要注冊即可制作feed并使用。
聯(lián)系客服