dedecms采集搜狐新闻的配置文件_复制即可使用 | 胡鹏博客
首页 > dedecms > dedecms采集搜狐新闻的配置文件_复制即可使用
2012八月20

dedecms采集搜狐新闻的配置文件_复制即可使用

前几天为大家介绍了用dedecms采集qq新闻dedecms采集新浪新闻的文章,那今天我们就来和大家一起分享用dedecms采集搜狐新闻的一些文章
方法还是一样,博主给出大家最源始的配置文件,需要的网友,只要复制下面的配置文件,导入进去,再做相应的更改就可以啦
举例说明:如果要采集http://sports.sohu.com/s2010/icehockey2010/这个列表的新闻,那我们只需要把这下面的配置文件导入进去就ok.

{dede:listconfig}
{dede:noteinfo notename="搜狐采集" channelid="1" macthtype="string"
    refurl="http://sports.sohu.com/20120724/n348901082.shtml" sourcelang="gb2312" cosort="asc"
  isref="no" exptime="10" usemore="0" /}
{dede:listrule sourcetype="batch" rssurl="http://" regxurl="http://"
startid="1" endid="" addv="1" urlrule="area" musthas=".shtml"
 nothas="" listpic="1" usemore="0"}
    {dede:addurls}http://sports.sohu.com/s2010/icehockey2010/{/dede:addurls}
    {dede:batchrule}{/dede:batchrule}
    {dede:regxrule}{/dede:regxrule}
    {dede:areastart}<div>
{/dede:areastart}
    {dede:areaend}<div>{/dede:areaend}
{/dede:listrule}

{/dede:listconfig}

{dede:itemconfig}
{dede:sppage sptype='full' srul='1' erul='5'}{/dede:sppage}
{dede:previewurl}http://sports.sohu.com/20120312/n337466635.shtml{/dede:previewurl}
{dede:keywordtrim}搜狐{/dede:keywordtrim}
{dede:descriptiontrim}搜狐{/dede:descriptiontrim}
{dede:item field='title' value='' isunit='' isdown=''}
   {dede:match}<title>[内容]</title>{/dede:match}
   {dede:trim replace=""}-搜狐体育|_搜狐体育{/dede:trim}
   {dede:function}{/dede:function}
{/dede:item}{dede:item field='writer' value='' isunit='' isdown=''}
   {dede:match}{/dede:match}

   {dede:function}{/dede:function}
{/dede:item}{dede:item field='source' value='' isunit='' isdown=''}
   {dede:match}<span id="media_span">[内容]</span>{/dede:match}
   {dede:trim replace="胡鹏博客"}搜狐体育{/dede:trim}
   {dede:function}{/dede:function}
{/dede:item}{dede:item field='pubdate' value='' isunit='' isdown=''}
   {dede:match}<div>[内容]</div>{/dede:match}

   {dede:function}{/dede:function}
{/dede:item}{dede:item field='body' value='' isunit='1' isdown='1'}
   {dede:match}<!-- 正文 -->[内容]<!-- 分享 -->{/dede:match}
   {dede:trim replace=""}<a([^>]*)>|</a>{/dede:trim}
{dede:trim replace=""}<script([^>]*)>(.*)</script>{/dede:trim}
{dede:trim replace="胡鹏博客"}搜狐体育{/dede:trim}
{dede:trim replace=""}此稿为新华社体育专线稿件,严禁转载。|此稿为新华社体育专线稿件|严禁转载{/dede:trim}
{dede:trim replace=""}<iframe([^>]*)>(.*)</iframe>{/dede:trim}
   {dede:function}{/dede:function}
{/dede:item}
{/dede:itemconfig}

可以直接采集就会看到效果,如果不是你想要的,你就进入dedecms后台点采集->采集结点管理->导入配置然后修改 引用网址,手工指定网址,预览网址这三项就可以开始采集啦.也还可以更改其它.

更多

文章作者:东莞seo
本文链接地址:http://www.seostudying.com/821.html
欢迎转载,转载请注明出处»胡鹏博客 [dedecms采集搜狐新闻的配置文件_复制即可使用]

本文目前尚无任何评论.
您必须在 登录 后才能发布评论.