如何添加dedecms类型网站采集功能?
如何添加dedecms类型网站采集功能?请阅读下文。
1.登陆dedecms后台→采集——采集节点管理——增加新节点
2.比如我们采集的普通文章,我们选择普通文章,然后确定
3.进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,你可以任意填写,自己清楚就行。
4.打开想要采集的文章列表页。利用快捷键ctrl+U或者鼠标右键——查看源文件找到目标页面编码,就在charset后面)
5.填写列表网址获取规则看看文章栏目列表第一页的地址【比如http://www.123.com/xinwenzixun/list_2_2.html和http://www.123.com/xinwenzixun/list_2_3.html】
6.从这里可以发现list_2_后面的数字不一样,其他的都一样,所以我们可以这样写http://www.123.com/xinwenzixun/list_2_(*).html就是把1换成了(*)因为这里只有2页,所以我们就填从1到2每页递增当然是1了,2-1...是等于1吧
7.填写文章网址匹配规则了,回到文章页、CTRL+U快捷键或者鼠标右键查看源文件找到文章列表页区域开始的HTML,就是找开始的标志。如图,在用ctrl+F快捷键,查看是否是整篇文章中唯一的开始标签。同理,我们可以找到文章结束的标签。
a.文章列表页内容开始标签
a.文章列表页内容结束标签
8.根据上面找出的开始标签以及结束标签,写着下面对应的方框中,然后点击保存并且测试按钮,你会发现单纯这样文章内容是不能采集的,所以我们还需要接着往下浏览。
9.点击最上面的【内容配置】根据你需要的填写对应的内容
10.比如采集相关文章的标题,我们可以利用键盘快捷键CTRL+U或者鼠标右键查看源代码,找到文章的标题,在利用ctrl+F快捷键查看是否是唯一的一个代码标签,如果是,就添加在对应的方框里面,如果不是,在查找附近的,直到唯一的标签为止。
11.同理,添加内容的开始标签以及结束标签。值得提示的是,我们在采集别人网站文章的时候,有时候是需要过滤掉别人的信息的,这个时候 可以点击【过滤规则】最右边的常用规则。
12.具体的图片在下面,根据具体的情况来选择,点击确定就可以了,当然我们在最后的时候还需要点击【保存并且测试】,这样才可以保存采集规则。