[参数]在火车采集器中是一个标记标签,用来匹配某些待提取的信息。这里和(*)区分开来,(*)是通配符号,用来代表某些应被忽略的信息。[参数]出现在内容网址获取和内容标签的正则提取中,如图:
关于[参数]、[参数1]、[参数N]?这三者之间是什么样的存在?
比如:http://www.dianping.com/hefei/food如果hefei和food都是我们需要提取利用的内容,那么在写提取规则的时候我们就把它们标记为参数标签:http://www.dianping.com/[参数]/[参数]而在拼接地址的时候就是对上面提取的参数进行利用,在这里我们提取到的参数已经进行了排序,所以hefei和food就分别为是我们提取到的[参数1]和[参数2]。但在写拼接地址的时候,我们会发现旁边出现的标签是[参数N]而不是[参数1]、[参数2],这是为什么呢?
其实[参数N]的作用是我们点击一次时就自动出现[参数1]、再点击就依次出现[参数2]、[参数3]……方便需要利用多个参数的情况。
如果依次出现的参数序号和拼接目标不同,我们还可自行修改数字调整参数位置,如上动态图片~
知道怎么用了,但具体用在什么地方呢?下面奉上大众点评中用参数拼接地址的真实操作案例:
进入商家列表页面后我们需要获取商家的地址,点击一个商家看看地址的格式。
回到列表页,查看页面源代码,可以发现商家的地址是不全的,因此我们需要借用源代码中的信息拼接出一个完整的内容页地址。这时源代码中的内容页地址信息就可以借助参数提取出来,不多说,看下图规则。
这里的[参数1]就是点击[参数N]后出来的哟,内容页地址拼接完成后我们来测试一下~
这样就拼接成功啦~
RSS