用dedecms采集新浪新闻的方法 | 胡鹏博客
首页 > dedecms > 用dedecms采集新浪新闻的方法
2012八月15

用dedecms采集新浪新闻的方法

用dedecms怎样采集新浪新闻呢!现在很多的小型的门户网站都有自己的资源站,但是要每个资源站都自己来写文章,发表文章,不仅需要大量的人力物力,而且量也很大,故而都会选择伪原创,采集大型的门户数据,把它们综合成自己的
那接下来,胡鹏博客就为大家提供一下,用dedecms采集新闻新闻的方法.

如果我要采集http://sports.sina.com.cn/nba/okc.shtml这个网页下的所有文章,那我改怎么配置呢dedecms呢,
下面提供一段代码,你首先复制下面代码,然后进入dedecms后台点采集->采集结点管理->导入配置然后修改 引用网址,手工指定网址,预览网址这三项,你再保存并测试就可以啦

{dede:listconfig}
{dede:noteinfo notename="俄克拉荷马城雷霆_新浪" channelid="1" macthtype="string"
refurl="http://sports.sina.com.cn/k/2012-07-20/06186140620.shtml" sourcelang="gb2312" cosort="asc"
isref="no" exptime="10" usemore="0" /}
{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://"
startid="1" endid="" addv="1" urlrule="area" musthas="http://sports.sina.com.cn/k/"
nothas="" listpic="1" usemore="0"}
{dede:addurls}http://sports.sina.com.cn/nba/okc.shtml{/dede:addurls}
{dede:batchrule}{/dede:batchrule}
{dede:regxrule}{/dede:regxrule}
{dede:areastart}<div id="right">{/dede:areastart}
{dede:areaend}</div>{/dede:areaend}
{/dede:listrule}

{/dede:listconfig}

{dede:itemconfig}
{dede:sppage sptype='full' srul='1' erul='5'}{/dede:sppage}
{dede:previewurl}http://sports.sina.com.cn/k/2012-07-20/06186140620.shtml{/dede:previewurl}
{dede:keywordtrim}{/dede:keywordtrim}
{dede:descriptiontrim}{/dede:descriptiontrim}
{dede:item field='title' value='' isunit='' isdown=''}
{dede:match}<title>[内容]</title>{/dede:match}
{dede:trim replace=""}_篮球-NBA_新浪竞技风暴_新浪网{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='writer' value='' isunit='' isdown=''}
{dede:match}{/dede:match}

{dede:function}{/dede:function}
{/dede:item}{dede:item field='source' value='' isunit='' isdown=''}
{dede:match}<span>[内容]</span>{/dede:match}
{dede:trim replace="胡鹏博客"}新浪体育{/dede:trim}
{dede:trim replace=""}<a([^>]*)>|</a>{/dede:trim}
{dede:function}{/dede:function}
{/dede:item}{dede:item field='pubdate' value='' isunit='' isdown=''}
{dede:match}<span id="pub_date">[内容]</span>{/dede:match}

{dede:function}{/dede:function}
{/dede:item}{dede:item field='body' value='' isunit='1' isdown='1'}
{dede:match}<!--正文上部推广 begin-->[内容]<!-- publish_helper_end -->{/dede:match}
{dede:trim replace=""}<a([^>]*)>|</a>{/dede:trim}
{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
{dede:trim replace=""}<!--(.*)-->{/dede:trim}
{dede:trim replace=""}<style([^>]*)>(.*)</style>{/dede:trim}
{dede:trim replace=""}<iframe([^>]*)>(.*)</iframe>{/dede:trim}
{dede:trim replace="胡鹏博客"}新浪体育{/dede:trim}
{dede:trim replace=""}\(微博\){/dede:trim}
{dede:trim replace="图形"}点击观看组图|点击观看高清组图{/dede:trim}
{dede:trim replace=""}\(<span([^>]*)>点击观看进球视频</span>\){/dede:trim}
{dede:trim replace=""}(<span([^>]*)>点击观看进球视频</span>){/dede:trim}
{dede:trim replace=""}\(点击观看进球视频\){/dede:trim}
{dede:trim replace=""}\(点击观看进球视频\){/dede:trim}
{dede:function}{/dede:function}
{/dede:item}
{/dede:itemconfig}

更多

文章作者:东莞seo
本文链接地址:http://www.seostudying.com/806.html
欢迎转载,转载请注明出处»胡鹏博客 [用dedecms采集新浪新闻的方法]

本文目前尚无任何评论.
您必须在 登录 后才能发布评论.