(8)脚本定时自动增量功能。
方法二:在WordPress插件官网下载,然后上传安装
https://Wordpress.org/plugins/wp-jpost/
如何添加采集任务?
任务名
命名请使用英文字母数字组合. 例:douban。登录后复制
这里填写目标网站首页的地址,以/结束。 例:HTTPS://www.douban.com登录后复制
列表页一般都是二级页面,是栏目的具体展示页,一般是用页内跳转的链接。 例如:https://www.douban.com/group/meitUIkong/登录后复制
入库目标分类id
WORDPRESS 后台 -- 文章 -- 分类目录 -- 编译你想入库到的分类 -- 查看浏览器地址栏的地址。 例:/wp-admin/term.php?taxonomy=category&tag_ID=38... 这里的tag_ID=38,这个38就是我们需要填写的值。登录后复制
标签
wordPress 入库时,写入文章的标签值。多个标签请使用,分割(英文状态的逗号分隔) 例:wordpress,LaoJi,wp-jpost。登录后复制
目标网站a链接元素
列表页中到二级目录的链接地址,同jquery选择器方法。登录后复制
分页格式
列表页中第二页区别列表页的地方。例: 列表页地址:https://www.douban.com/group/meituikong/ 翻页后变成:https://www.douban.com/group/meituikong/discussion?start=8850 那么这里就填写:discussion?start={PAge} 这里的 {page} 就是翻页变化的地方。登录后复制
分页最大值
这里填写翻页后最后的page值。例: http://147hub.com/page/2052 这里翻页的最大值,即填写:2052登录后复制
内容页中标题、内容的标签值。同jQUEry选择器方法。下面我们具体得讲述一下怎么选择元素。
首先我们需要使用chrome、firefox之类的浏览器。这些浏览器都具有调试等功能。我们这里以Firefox为例。
首先分析代码,以下元素标签可以是div , h3 ,title ,span , p 等。 例:...元素标签>,那么我们应该则填入:元素标签.classname。 例:...元素标签>,那么我们应该则填入:元素标签#classname。
步骤:
1、网页空白处右击 -- 查看元素 。 下面会弹出一个调试器出来。
内容搜索值 、内容替换值(可以批量多个替换)
比如标题正文中带有一些原来的字符串,我想替换成我的,或者不要了。 注意:这里如想替换成一样的值,可以直接写一个。如每个替换成不同的则需要对应填。
例:
搜索值:- 摔角资料, - 赛事新闻 - 摔角网, - 赛事战报, - 摔角网
替换值:
搜索值:搜索1,搜索2,搜索3
替换值:替换1,替换2,替换3 注意这里要一一对应。例如搜索2去要替换成空则替换值也需要留空(替换1,,替换2),否则就不能对应替换了。