火车采集器保存为本地word、excel、html、txt文件方法及文件模板_爬虫软件技术与爬虫软件网页数据采集器门户

火车采集器如何将采集到的数据发布到本地的文件 TXT 或者CSV 等格式乱码

解决办法:

模版文件,用txt格式打开,然后 文件—另存为,选择ansi编码 然后发布设置那里 选择GBK 编码,或者

文件—另存为,选择utf-8编码 然后发布设置那里 选择UTF-8 发布即可

1、 我们以软件自带的火车采集器采集规则 搜狐新闻 为例子

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程1

2、 双击火车采集器采集规则,打开 搜狐新闻 这个规则

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程2

第三步:发布内容设置勾选 “方式二”的启用保存文件格式(自己可根据需要来选择)

3、 保存位置,这里就不做说明了,想保存到哪里就保存到哪里你的地盘你自个做主~

4、 文件模版,简单的说就是你保存到文件的具体模版样式。

以 “搜狐新闻”为例做txt文件模版

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程3

有5个标签

所以txt模版对应写上就可以了

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程4

模版会自动提取相应的标签内容。

Html 模版也是一样的

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程5

csv模版

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程6

Word模版亦是如此

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程7

5、 火车采集器文件名格式

火车采集器如何保存为本地word、excel、html、txt文件方法及文件模版说明截图教程8

点击这个按钮,可出现一个选择列表,这里可以任意选择匹配,给文件命名。

6、 火采集器文件编码

有utf-8和 gb2312 两种。 发布后 如果显示是乱码 ,就可能是你的编码没设置正确,换一种 应该就可以了。

嗯 就这些了,写的非常的直白,应该都可以看懂~~

本人擅长Ai、Fw、Fl、Br、Ae、Pr、Id、Ps等软件的安装与卸载,精通CSS、JavaScript、PHP、ASP、C、C++、C#、Java、Ruby、Perl、Lisp、Python、Objective-C、ActionScript、Pascal等单词的拼写,熟悉Windows、Linux、OS X、Android、iOS、WP8等系统的开关机。

通过下面的方式来联系我们:

电邮:138762189@qq.com

联系QQ:点击这里给我发消息

官方站:www.tadke.com

※ ※ 联系请加我的企鹅号 ※※

※ ※技术支持请微信联系站长 ※※

Copyright © 2023 Tadke.com. 琼ICP备20000547号