更新采集系统-可采集任意站点

教程地址:http://player.youku.com/embed/XMTM4NzA3MzkxNg==

 今天重新做一下发布站的采集规则如何设置的教程!以前的教程有人反应无法观看,今天重新做一下!

这个是前两天一个客户要求做的网站,我们就用这个来测试吧


私服列表页地址列表(每行一个):要采集的目标网址


网站名称:就写目标站的网址吧,方便区分


私服列表开始标志:(这个是指要采集目标站的开始代码位置)

 

私服列表结束标志:(这个是指要采集目标站的结束代码位置)


@@@开始和结束标志的意思就是,我们要取从开始到结束这个区域里面的内容@@@

 

私服单行项匹配规则:(这个是指去匹配刚才我们指定的区域代码中和我们这个规则相符的数据)

这样我们需要取的内容标签去替换掉里面的内容,$任意$这个标签再去替换掉里面可能是不一样的数据的内容,比如还有网址没替换完,因为我们只需要一个,剩下的网址,不同的广告网址会不一样的,所以我们要用$任意$去替换掉,#0000ff这个是颜色代码,不同的广告可能颜色不同,我们也用$任意$替换掉,根据不同的网站设置吧,因为不同的广告代码不一样的,目前这个站其本上这样就行了

 

添加采集,和采集广告有时反应慢,这是正常的,因为用户太多了(收费用户和免费用户都用的同一个服务器来处理数据,所以很慢,我们打算年底就停掉免费用户的使用权限了)

有点慢,使用时请耐心等一下!

现在我们试一下刚才添加的采集


共采集了860条信息 ,实际上这个网站的广告不止这么多,因为他网站上不同的广告代码是不同的,我们只能匹配出和我们规则相同的广告出来

看见我刚才选的了吧?他有4种代码来显示广告,我们只写了一种,如果你想全部采集过来,那就得要多设置几个规则


好了,这是刚才采的广告,好了,教程完了,其实很简单,没想法又打这么多字

木木网络  www.41995.cn  QQ 3341100

Copyright 2006-2013 Powered By 木木网络 黑ICP备09006085号
专业发布站程序制作,出售发布站程序模板,专用CMS网站排名优化模板