火车采集器如何将图片转换为号码OCR图像识别配置管理工具_爬虫软件技术与爬虫软件网页数据采集器门户

1、以制作赶集网的图片手机号码 转换文字 为例

手机号码图片网址 http://bj.ganji.com/tel/52650234566157315535536b513f006051650f3e5231_4.png

2、打开火车采集器ocr识别工具

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图1

3、 OCR图像识别配置

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图2

保存配置后 会生成一个 .ocr 识别文件。

4、标签里调用这个 .ocr识别文件

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图3

OCR识别程序是一个通用的图片文字识别程序,可以对一些简单的字母或是数字的图片进行识别

OCR图像识别预处理:

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图4

通过预处理可以去除一些干扰,来提高识别率。

1、亮度/对比度

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图5

用以调节图像的亮度和颜色的对比度

2、OCR图像识别灰度

效果图:

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图6

相当于彩色变黑白的效果

3、OCR图像识别边框

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图7

通过定义边框相对于图像上下左右的距离裁剪图像

4、OCR图像识别去除噪点

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图8

通过设置相邻点个数,来去除孤立的点

5、OCR图像识别边缘扫描去色

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图9

通过设置边缘的宽度,程序将会收集在该区域内的所有颜色。然后扫描整个图像。如果像素点的颜色和之前收集的颜色差在[色差异异]的范围内,则将该点的颜色置白。

6、OCR图像识别二值化

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图10

可通过调节阀值来讲图像二值化,将阀值两边的颜色变成黑白两种颜色。

7、OCR图像识别底色

将图像的颜色调换相反的颜色

8、OCR图像识别删除替换颜色

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图11

通过设置颜色区间。扫描图像删除所有区间内的颜色。可以将原来的颜色替换成另一种颜色。

字符过滤

火车采集器如何将图片转换为号码OCR图像识别配置管理工具教程截图12

可通过设置白名单和黑名单字符集来提高识别率。

本人擅长Ai、Fw、Fl、Br、Ae、Pr、Id、Ps等软件的安装与卸载,精通CSS、JavaScript、PHP、ASP、C、C++、C#、Java、Ruby、Perl、Lisp、Python、Objective-C、ActionScript、Pascal等单词的拼写,熟悉Windows、Linux、OS X、Android、iOS、WP8等系统的开关机。

通过下面的方式来联系我们:

电邮:138762189@qq.com

联系QQ:点击这里给我发消息

官方站:www.tadke.com

※ ※ 联系请加我的企鹅号 ※※

※ ※技术支持请微信联系站长 ※※

Copyright © 2023 Tadke.com. 琼ICP备20000547号