1、以制作赶集网的图片手机号码 转换文字 为例
手机号码图片网址 http://bj.ganji.com/tel/52650234566157315535536b513f006051650f3e5231_4.png
2、打开火车采集器ocr识别工具
3、 OCR图像识别配置
保存配置后 会生成一个 .ocr 识别文件。
4、标签里调用这个 .ocr识别文件
OCR识别程序是一个通用的图片文字识别程序,可以对一些简单的字母或是数字的图片进行识别
OCR图像识别预处理:
通过预处理可以去除一些干扰,来提高识别率。
1、亮度/对比度
用以调节图像的亮度和颜色的对比度
2、OCR图像识别灰度
效果图:
相当于彩色变黑白的效果
3、OCR图像识别边框
通过定义边框相对于图像上下左右的距离裁剪图像
4、OCR图像识别去除噪点
通过设置相邻点个数,来去除孤立的点
5、OCR图像识别边缘扫描去色
通过设置边缘的宽度,程序将会收集在该区域内的所有颜色。然后扫描整个图像。如果像素点的颜色和之前收集的颜色差在[色差异异]的范围内,则将该点的颜色置白。
6、OCR图像识别二值化
可通过调节阀值来讲图像二值化,将阀值两边的颜色变成黑白两种颜色。
7、OCR图像识别底色
将图像的颜色调换相反的颜色
8、OCR图像识别删除替换颜色
通过设置颜色区间。扫描图像删除所有区间内的颜色。可以将原来的颜色替换成另一种颜色。
字符过滤
可通过设置白名单和黑名单字符集来提高识别率。
RSS