火车采集器V9.7多页功能详细教程介绍_爬虫软件技术与爬虫软件网页数据采集器门户

我们在采集网页信息过程中经常遇到信息不在同一个页面,那就要使用多页功能,今天在这里以采集安居客小区信息为例讲解火车采集器V9的多页设置。因为主要讲解多页,案例中的其他设置略过!
下面我们来介绍一下火车采集器V9.7多页功能详细教程。

火车采集器V9.7多页功能详细教程介绍截图1

我们要抓取的信息中有小区的房源数量数据,发现在网页源码中并没有此数据。通过抓包软件fiddler抓包分析可以获取到该数据的真实网址,参照下图:

火车采集器V9.7多页功能详细教程介绍截图2

火车采集器V9.7多页功能详细教程介绍截图3

通过网址可以发现一个ID参数“337684”,于是我们可在内容页源码中看能否查找到该ID值

火车采集器V9.7多页功能详细教程介绍截图4

通过搜索我们发现源码中存在这个值,那我们就可以通过这个值 在多页功能中拼接出房源数量数据的网址,参照下图:

首页我们要添加多页,在内容采集规则步骤中左侧下方有个关联多页,我们点击+号进行添加多页

火车采集器V9.7多页功能详细教程介绍截图5

获取多页网址和获取内容页网址原理一样,也是通过源码找出规则。因在内容页中并没有完整的该多页的链接,但可以采到网址中的ID参数,于是我们只需获取到ID即可,然后拼接出多页网址,参照下图:

火车采集器V9.7多页功能详细教程介绍截图6

起一个名称,保存多页,下一步我们就可以通过此页获取房源数量

火车采集器V9.7多页功能详细教程介绍截图7

火车采集器V9.7多页功能详细教程介绍截图8

添加标签,通过拼接的多页网址,分析获取数据规则,注意上图的数据来源,一定要选择关联多页。这样我们就可以通过多页功能获取到隐藏的房源数量信息了,你学会了吗?

本人擅长Ai、Fw、Fl、Br、Ae、Pr、Id、Ps等软件的安装与卸载,精通CSS、JavaScript、PHP、ASP、C、C++、C#、Java、Ruby、Perl、Lisp、Python、Objective-C、ActionScript、Pascal等单词的拼写,熟悉Windows、Linux、OS X、Android、iOS、WP8等系统的开关机。

通过下面的方式来联系我们:

电邮:138762189@qq.com

联系QQ:点击这里给我发消息

官方站:www.tadke.com

※ ※ 联系请加我的企鹅号 ※※

※ ※技术支持请微信联系站长 ※※

Copyright © 2023 Tadke.com. 琼ICP备20000547号