火车头采集器 v7.6绿色版是一款功能强大且易于上手的专业的互联网数据抓取、处理、分析,挖掘软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器。软件可以灵活迅速地抓取网页上散乱分布的数据信息,并通过一系列的分析处理,准确挖掘出所需数据。火车采集器历经十年的升级更新,积累了大量用户和良好口碑,是目前最受欢迎的网页数据采集软件。采集不限网页,不限内容,支持多种扩展,打破操作局限。采什么,如何采,都由您决定!
功能介绍
1、Web发布配置管理
2、任务运行日志查看器
3、任务设置批量复制
4、数据库入库配置管理
5、简易验证码识别系统
6、获取源代码、http模拟提交工具
安装说明
一、火车头数据采集平台要求:您的电脑必须安装.net framework2.0或2.0以上框架.如果您的采集器打不开,请下载并安装该框架
附windows .net framework 2.0 下载地址
32位下载地址:http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe
64位下载地址:http://download.microsoft.com/download/a/3/f/a3f1bf98-18f3-4036-9b68-8e6de530ce0a/NetFx64.exe
二、在
百度网盘下载并解压软件包,打开文件夹运行LocoyPlatform.exe主程序就可以直接安装使用了
软件特性
1、无限级多页采集,可以实现无限深度的采集
2、任务队列运行管理,支持Cron表达式
3、无限级分组任务管理,任务回收站功能
4、RSS地址采集功能
5、列表页分页采集获取功能
6、列表页附加参数获取功能
7、列表页及标签XPath可视化提取功能
8、标签纯正则替换功能
9、Http接口查看运行情况
10、导出记录为单个或多个Txt、html 文件
11、标签间自由组合功能
12、针对标签内容继续发送Http请求功能
13、无限级列表网址采集
14、从Http头信息中获取数据
15、标题内容正文提取功能
16、Aspx列表分页自识别
17、多网站站群式web发布
18、导出记录为Word格式
19、导出所有记录为Excel格式
20、使用随机二级代理服务器(支持Socket代理)
21、多扩展间数据交换功能
22、下载的图片自动加增强型水印功能
23、Ocr识别(图片转化为文字)
24、Http接口管理采集器运行
25、Mongodb数据库保存数据
26、主从服务器分布式采集
点击星星用来评分