杰灵采集器是一款实用的网页数据采集软件,接入discuz,wordpress,dedecms,帝国cms等开源接口,提供列表采集、内容采集、内容发布分布或合并批量采集,还具有附件上传和图片附件下载保存等功能,支持指定URL网址,需要的朋友赶快下载吧!
软件特色
免费实用
全部功能免费开放,免费提供开源发布接口
支持单页抓取
支持指定URL网址 抓取内容
多线程抓取
多任务多线程快速抓取
批量采集
列表采集、内容采集、内容发布分步或合并批量采集
SQLite数据库
广泛使用的SQLite数据库存贮,轻型高效
图片附件下载保存
采集同时保存远程图片本地化
附件上传
支持图片附件自动上传至网站
通用网站接口
discuz,wordpress,dedecms,帝国cms等开源程序
自动缩略图
内容页提取首页图片为缩略图
图片水印
自定义logo或文字水印
正则表达式
支持正则提取或过滤内容
多级页面采集
支持无限级多级页面抓取
杰灵采集器使用教程
wordpress4.9采集教程
下面的这个示例,自带采集规则,除了图3需要修改成您的域名之外,其他全程用鼠标操作即可!
1、打开软件界面 双击左侧任务栏 里的【本地任务】下的【wordpress实例】任务(见图1)
图1
1.1、选择【发布内容】-点击【编辑】
图2
1.2、双击“您对应的程序”后,修改域名xxx.com为您的网站域名,并选择对应【网站编码】,后点击【保存】规则。再右上角关闭本窗口
图3
1.3、在【发布内容】界面 选择您刚修改的 发布规则名称,如图4所示
图4
1.4、点击【加载栏目】 ,选择要发布的栏目,如图5所示
图5
2、在程序 主界面右侧 输入您要采集的文章网址,并点击采集,如图6所示
图6
2.1、采集结束,将出现可视编辑对话框。 点击关闭
图7
2.2、点击发布按扭。 弹出对话框 即为成功。
图8
2.3 保存本采集任务,见图9
图9
3、开始批量采集
本示例已为您写好采集规则。请直接点鼠标操作即可。不用额外修改了。
3.1 将任务拖到右侧启动栏里 (见图10)
图10
3.2 开始任务 (见图11)
3.1 将任务拖到右侧启动栏里 (见图10)
=========================================
以下为正在进行中的任务
以下为发布完成的wordpress后台截图
=================
采集任务可以随便复制粘贴做备份参考使用。
选择图5,选择不同的发布规则,即可发布到其他网站系统。
更多功能,可以详见其他教程。
更新日志
1、新增支持php插件,支持回调修改其他字段(详见-->点击)
2、新增支持javascript插件,支持回调修改其他字段(详见-->点击 )
3、新增数据库报表支持多选
4、新增过滤筛选支持文本导入,全局关键词过滤
5、新增列表区域提取 支持正则提取 如[sS]+提取全文
6、新增字段设置 内置大量常用规则,点击图标,快速选用即可
7、新增采集的时候可指定ssl版本号(设置1.1或1.2或留空)
8、新增EXCEL导入支持指定EXCEL起始行
9、新增数据查看器,sql语句历史纪录功能
10、新增网址包含 可用|(或)筛选网址
11、新增单篇发布,如404,500错误 ,将显示错误文本
12、修复WIN2012以上版本远程桌面特殊情况导致无法保存任务的BUG
13、修复内容页分页内存溢出bug
14、修复列表采集超长时间延时无法快速停止的bug
15、修复//开头的无协议链接,自动转化为对应协议http(s)://
软件评论 您的评论需要经过审核才能显示
网友评论