快捷登录,享 免费下载
首页 > 教程资讯 > 教程详情

火车采集器的教程

补充锦囊 完美下载小客服 2021-03-30
文章分享
软件首页

完美者(wmzhe.com)网站以软件下载为基础,改版后的网站对功能性板块进行扩充,以期能够解决用户在软件使用过程中遇见的所有问题。网站新增了“软件百科”、“锦囊妙技”等频道,可以更好地对用户的软件使用全周期进行更加专业地服务。

火车采集器(LocoySpider)是一款专业的功能强大的网络数据/信息挖掘软件。通过灵活的配置,您可以很轻松的从网页上抓取文字、图片、文件等任何资源。程序支持远程下载图片文件,支持网站登陆后的信息采集,支持探测文件真实地址,支持代理,支持防盗链的采集,支持采集数据直接入库和模仿人手工发布等许多功能特点。火车采集器支持从任何类型的网站采集获取您所需要的信息,如各种新闻类网站、论坛、电子商务网站、求职招聘网站等。同时具有强大的网站登录采集、多页和分页的采集、网站跨层采集、POST采集、脚本页面采集、动态页面采集等高级采集功能。强大的php和c#插件支持,让您可以通过二次开发实现您所想要的任何更强大的功能。

火车采集器功能

  1. 规则自定义 - 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。
  2. 多任务,多线程 - 可以同时进行多个信息采集任务,每个任务可以使用多个线程。
  3. 所见即所得 - 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。
  4. 数据保存 - 数据边采集边自动保存到关系数据库中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。
  5. 断点续采 - 信息采集任务可以在停止后从断点开始继续采集,从此你用不再担心你的采集任务意外中断了。
  6. 网站登录 - 支持网站Cookie,支持网站可视化登录,即使登录时需要验证码的网站也能采集。
  7. 计划任务 - 通过这个功能可以让你的采集任务定时、定量或者一直循环执行。
  8. 采集范围限制 - 可以根据采集的深度和网址的标识来限制采集的范围。
  9. 文件下载 - 可以将采集到的二进制文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。
  10. 结果替换 - 可以将采集的结果根据规则替换成你定义的内容。
  11. 条件保存 - 可以根据某个条件来决定那些信息保存,那些信息过滤。
  12. 过滤重复内容 - 软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。
  13. 特殊链接识别 - 运用此功能可以将用JavaScript动态生成的链接或其他更古怪的连接识别出来。
  14. 数据发布 - 可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库(access, sql server,my sql,oracle) ,静态htm文件。
  15. 预留编程接口 - 定义多个编程接口,用户可以在事件中利用PHP,C#语言进行编程,扩充采集功能。

火车采集器特色

  1. 支持所有网站编码:完美支持采集所有编码格式的网页,程序还可以自动识别网页编码。
  2. 多种发布方式:支持目前所有主流和非主流的CMS,BBS等网站程序,通过系统的发布模块能实现采集器和网站程序间的完美结合。
  3. 全自动:无人值守工作,配置好程序后,程序将依据您的设置自动运行,完全无需人工干预。
  4. 本地编辑:本地可视化编辑已采集的数据。
  5. 采集测试:这是其它任何同类采集软件所不能比的,程序支持直接查看采集结果并测试发布。
  6. 管理方便:使用站点+任务方式管理采集节点,任务支持批量操作,再多的数据管理也很轻松。
  7. 通用性强:无论新闻、论坛、视频、黄页、图片、下载类网站,只要通过浏览器能看到的结构化的内容,通过指定匹配规则,都能采集到您所需要的内容。
  8. 稳定、高效:五年磨一剑,软件不断更新进步,采集速度快,性能稳定,占用资源少。
  9. 扩展性强、适用范围广:自定义web发布,自定义主流的数据库的保存和发布,自定义本地php及.net外部编程接口处理数据,让数据都能为你所用。

火车采集器更新日志

  1. 修改软件启动界面,使用更为友好
  2. 增加插件异常处理,方便调试插件
  3. 运行日志增加任务id
  4. 修复非管理员开机启动失败问题、
  5. 修复任务批量处理非内容标签复制问题
  6. 修复"如果为空再次提取"的bug
  7. WECenter的UBB转化功能完善
  8. 随机插入功能改进
  9. 修复ul,ol等标签带style时无法过滤问题
  10. 官方插件模块接口等资源更新

"锦囊妙技"栏目是聚合全网软件使用的技巧或者软件使用过程中各种问题的解答类文章,栏目设立伊始,小编欢迎各路软件大神朋友们踊跃投稿,在完美者平台分享大家的独门技巧。

本站文章素材来源于网络,大部分文章作者名称佚失,为了更利于用户阅读和使用,根据需要进行了重新排版和部分改编,本站收录文章只是以帮助用户解决实际问题为目的,如有版权问题请联系小编修改或删除,谢谢合作。

火车采集器

火车采集器

软件大小:23.29 MB

高速下载

相关问答

更多
  • 火车头如何采集百度搜索结果

    在火车头里面设置采集规则,你应该是要采集标题和描述,在规则里面设置规则即可。

  • 谁用过火车头采集器,给我讲讲是什么意思?如何使用?

    火车采集器(LocoySpider) 是一个供各大主流文章系统,论坛系统等使用的多线程内容采集发布程序。使用火车采集器,你可以瞬间建立一个拥有庞大内容的网站。系统支持远程图片下载,图片批量水印,Flash下载,下载文件地址探测,自制作发表的cms模块参数,自定义发表的内容等。此外,丰富的规则制定,内容替换功能,对Access,Mysql,MSsql的数据入库导出的支持,更可令你采集内容的时候得心应手,现在开始你可以抛弃过去重复乏味的手工添加工作了,请马上开始体验瞬间建站的乐趣吧! 火车采集器(LocoySpider)是一款功能强大且易于上手的专业采集软件,强大的内容采集和数据导入功能能将您采集的任何网页数据发布到远程服务器,自定义用户cms系统模块,不管你的网站是什么系统,都有可能使用上火车采集器,系统自带的模块文件支持:风讯文章,动易文章,动网论坛,PHPWIND论坛,Discuz论坛,phpcms文章,phparticle文章,LeadBBS论坛,魔力论坛,Dedecms文章,Xydw文章,惊云文章等的模块文件。更多cms模块请自己参照制作修改,也可到官方网站与大家交流制作。 同时您也可以使用系统的数据导出功能,利用系统内置标签,将采集到的数据对应表的字段导出到本地任何一款Access,MySql,MS SqlServer内。 LocoySpider采用Visual C#编写,可独立在Windows2003下运行,如您在Windows2000、Xp等环境下使用,请先到微软官方下载一个.net framework1.1或更高环境组件。

  • 如何用火车采集器采集数据

    火车采集器就是一款专业的采集工具,可以轻松从网页上抓取文字、图片、文件等任何资源。必须先下载好后,双击火车头图标打开采集器才可以使用

  • 火车头采集器好用吗?每天大概能采几个站?新手求指点!

    采集软件中的老牌子了,功能很强大,会使用的话95%的网站都能采集,要求速度的话得买个收费版的,采集文章速度很快。可以直接找人帮你编写采集规则,价格不贵,编写文章规则一般是5块或者10块一条!