牛骨文教育服务平台(让学习变的简单)
博文笔记

如何添加dedecms类型网站采集功能?

创建时间:2017-08-04 投稿人: 15010493684 浏览次数:317

如何添加dedecms类型网站采集功能?请阅读下文。

1.登陆dedecms后台→采集——采集节点管理——增加新节点

如何添加dedecms类型网站采集功能?

2.比如我们采集的普通文章,我们选择普通文章,然后确定

如何添加dedecms类型网站采集功能?

3.进入了采集的设置页面,填写节点名称,就是给这个新节点取个名字,你可以任意填写,自己清楚就行。

如何添加dedecms类型网站采集功能?

4.打开想要采集的文章列表页。利用快捷键ctrl+U或者鼠标右键——查看源文件找到目标页面编码,就在charset后面)

如何添加dedecms类型网站采集功能?

5.填写列表网址获取规则看看文章栏目列表第一页的地址【比如http://www.123.com/xinwenzixun/list_2_2.html和http://www.123.com/xinwenzixun/list_2_3.html】

6.从这里可以发现list_2_后面的数字不一样,其他的都一样,所以我们可以这样写http://www.123.com/xinwenzixun/list_2_(*).html就是把1换成了(*)因为这里只有2页,所以我们就填从1到2每页递增当然是1了,2-1...是等于1吧

如何添加dedecms类型网站采集功能?

7.填写文章网址匹配规则了,回到文章页、CTRL+U快捷键或者鼠标右键查看源文件找到文章列表页区域开始的HTML,就是找开始的标志。如图,在用ctrl+F快捷键,查看是否是整篇文章中唯一的开始标签。同理,我们可以找到文章结束的标签。

a.文章列表页内容开始标签

如何添加dedecms类型网站采集功能?

a.文章列表页内容结束标签

如何添加dedecms类型网站采集功能?

8.根据上面找出的开始标签以及结束标签,写着下面对应的方框中,然后点击保存并且测试按钮,你会发现单纯这样文章内容是不能采集的,所以我们还需要接着往下浏览。

如何添加dedecms类型网站采集功能?

9.点击最上面的【内容配置】根据你需要的填写对应的内容

如何添加dedecms类型网站采集功能?

10.比如采集相关文章的标题,我们可以利用键盘快捷键CTRL+U或者鼠标右键查看源代码,找到文章的标题,在利用ctrl+F快捷键查看是否是唯一的一个代码标签,如果是,就添加在对应的方框里面,如果不是,在查找附近的,直到唯一的标签为止。

如何添加dedecms类型网站采集功能?

11.同理,添加内容的开始标签以及结束标签。值得提示的是,我们在采集别人网站文章的时候,有时候是需要过滤掉别人的信息的,这个时候 可以点击【过滤规则】最右边的常用规则。

如何添加dedecms类型网站采集功能?

12.具体的图片在下面,根据具体的情况来选择,点击确定就可以了,当然我们在最后的时候还需要点击【保存并且测试】,这样才可以保存采集规则。

如何添加dedecms类型网站采集功能?

声明:该文观点仅代表作者本人,牛骨文系教育信息发布平台,牛骨文仅提供信息存储空间服务。