火车采集器9.7之[参数N]案例详细教程_爬虫软件技术与爬虫软件网页数据采集器门户

[参数]在火车采集器中是一个标记标签,用来匹配某些待提取的信息。这里和(*)区分开来,(*)是通配符号,用来代表某些应被忽略的信息。[参数]出现在内容网址获取和内容标签的正则提取中,如图:

关于[参数]、[参数1]、[参数N]?这三者之间是什么样的存在?

火车采集器9.7之[参数N]案例详细教程截图1

比如:http://www.dianping.com/hefei/food如果hefei和food都是我们需要提取利用的内容,那么在写提取规则的时候我们就把它们标记为参数标签:http://www.dianping.com/[参数]/[参数]而在拼接地址的时候就是对上面提取的参数进行利用,在这里我们提取到的参数已经进行了排序,所以hefei和food就分别为是我们提取到的[参数1]和[参数2]。但在写拼接地址的时候,我们会发现旁边出现的标签是[参数N]而不是[参数1]、[参数2],这是为什么呢?

其实[参数N]的作用是我们点击一次时就自动出现[参数1]、再点击就依次出现[参数2]、[参数3]……方便需要利用多个参数的情况。

火车采集器9.7之[参数N]案例详细教程截图2
如果依次出现的参数序号和拼接目标不同,我们还可自行修改数字调整参数位置,如上动态图片~

知道怎么用了,但具体用在什么地方呢?下面奉上大众点评中用参数拼接地址的真实操作案例:

火车采集器9.7之[参数N]案例详细教程截图3
进入商家列表页面后我们需要获取商家的地址,点击一个商家看看地址的格式。

火车采集器9.7之[参数N]案例详细教程截图4
回到列表页,查看页面源代码,可以发现商家的地址是不全的,因此我们需要借用源代码中的信息拼接出一个完整的内容页地址。这时源代码中的内容页地址信息就可以借助参数提取出来,不多说,看下图规则。

火车采集器9.7之[参数N]案例详细教程截图5

火车采集器9.7之[参数N]案例详细教程截图6

这里的[参数1]就是点击[参数N]后出来的哟,内容页地址拼接完成后我们来测试一下~

火车采集器9.7之[参数N]案例详细教程截图7
这样就拼接成功啦~

本人擅长Ai、Fw、Fl、Br、Ae、Pr、Id、Ps等软件的安装与卸载,精通CSS、JavaScript、PHP、ASP、C、C++、C#、Java、Ruby、Perl、Lisp、Python、Objective-C、ActionScript、Pascal等单词的拼写,熟悉Windows、Linux、OS X、Android、iOS、WP8等系统的开关机。

通过下面的方式来联系我们:

电邮:138762189@qq.com

联系QQ:点击这里给我发消息

官方站:www.tadke.com

※ ※ 联系请加我的企鹅号 ※※

※ ※技术支持请微信联系站长 ※※

Copyright © 2023 Tadke.com. 琼ICP备20000547号