火车采集器采集百度搜索采集关于标签循环匹配及标签在分页中_爬虫软件技术与爬虫软件网页数据采集器门户

有很多用户不知道火车采集器标签循环匹配及标签在分页中匹配这两个功能的使用,下面就以百度搜索列表采集为例,采集地址http://www.baidu.com/s?wd=%E9%87 … =32&inputT=3893,直接将这个列表页地址作为实际内容页采集,

火车采集器采集百度搜索采集教程截图1

查看源文件,得到每条记录标题所在的html代码格式是所以在采集标题时规则设置如下

火车采集器采集百度搜索采集教程截图2

打开火车采集器勾选截图中的该标签在循环中匹配,这样就可以循环采集到每条记录的标签,采集内容标签规则设置如下,一样需要设置循环匹配,

火车采集器采集百度搜索采集教程截图3

这个列表的分页需要在第二步分页设置中截取到分页连接地址,

火车采集器采集百度搜索采集教程截图4

火车采集器分页规则设置好后,勾选每个标签里的该标签在分页中匹配选项,

火车采集器采集百度搜索采集教程截图5

如果需要将采集的数据一条条保存,需要选择添加新纪录方式,

火车采集器采集百度搜索采集教程截图6

最后测试效果如下:

火车采集器采集百度搜索采集教程截图7

如果需要获取内容页地址或者内容地址中部分参数这就需要使用从网址中采集功能,然后使用正则采集,

火车采集器采集百度搜索采集教程截图8

本人擅长Ai、Fw、Fl、Br、Ae、Pr、Id、Ps等软件的安装与卸载,精通CSS、JavaScript、PHP、ASP、C、C++、C#、Java、Ruby、Perl、Lisp、Python、Objective-C、ActionScript、Pascal等单词的拼写,熟悉Windows、Linux、OS X、Android、iOS、WP8等系统的开关机。

通过下面的方式来联系我们:

电邮:138762189@qq.com

联系QQ:点击这里给我发消息

官方站:www.tadke.com

※ ※ 联系请加我的企鹅号 ※※

※ ※技术支持请微信联系站长 ※※

Copyright © 2023 Tadke.com. 琼ICP备20000547号