火车采集器采集淘宝天猫商品采集多页获取宝贝详细教程_爬虫软件技术与爬虫软件网页数据采集器门户

火车采集器以淘宝和天猫多页采集为例

淘宝,例如

http://item.taobao.com/item.htm?id=16598015559

需要采集此页的宝贝详细

火车采集器经过抓包等一系列分析 得到 详细页真实地址 是

http://dsc.taobaocdn.com/i5/160/ … bk%3Bt%5E1352562053

查看网页源代码 可以发现 在这里

火车采集器采集淘宝天猫商品采集多页获取宝贝详细教程截图1

此时我们需要用到 多页匹配到 这个详细页真实地址,然后根据这个真实地址 采集就可以了

1、 点击

火车采集器采集淘宝天猫商品采集多页获取宝贝详细教程截图2

 

2、 命名为宝贝详情,用第二种方式,正则参数匹配 得到这个真实网址。

火车采集器采集淘宝天猫商品采集多页获取宝贝详细教程截图3

3、 你也可以在这里测试下 得到的网址对不对。

4、 正确的话 就保存

5、 然后标签里 调用多页

火车采集器采集淘宝天猫商品采集多页获取宝贝详细教程截图4

(1) 这里选择刚才保存的那个多页

(2) 根据多页地址,也就是宝贝详情的真实地址,设置前台截取

(3) 保存即可。

6、 测试结果如下

火车采集器采集淘宝天猫商品采集多页获取宝贝详细教程截图5

 

++++++++++++++++++++++++++++++++++++++++++++++

天猫,例如

http://detail.tmall.com/item.htm?id=19828008229

火车采集器多页地址

http://dsc.taobaocdn.com/i2/191/ … bk%3Bt%5E1352697004

源代码里

火车采集器采集淘宝天猫商品采集多页获取宝贝详细教程截图6

剩下的步骤 可以尝试 自己写。。。

一样的道理。。。

本人擅长Ai、Fw、Fl、Br、Ae、Pr、Id、Ps等软件的安装与卸载,精通CSS、JavaScript、PHP、ASP、C、C++、C#、Java、Ruby、Perl、Lisp、Python、Objective-C、ActionScript、Pascal等单词的拼写,熟悉Windows、Linux、OS X、Android、iOS、WP8等系统的开关机。

通过下面的方式来联系我们:

电邮:138762189@qq.com

联系QQ:点击这里给我发消息

官方站:www.tadke.com

※ ※ 联系请加我的企鹅号 ※※

※ ※技术支持请微信联系站长 ※※

Copyright © 2023 Tadke.com. 琼ICP备20000547号