基于python的文字识别系统_基于Python的图片文本识别系统的研究

龙源期刊网

http://www.qikan.com.cn

基于

Python

的图片文本识别系统的研究

作者:韩琳

来源:《科学与财富》

2019

年第

20

近年来随着计算机技术的不断发展,

Optical Character Recognition

(光学字符识别,简称

“OCR”

)应用的领域更加的广泛,而图片文字识别就是其中重要的一个。目前图片文字识别的

准确率并没有达到

100%

,这也成为了图片文字识别发展领域的一大瓶颈,因此要去探索一个

好的图片文字识别算法是非常有意义的。

图片文字识别系统的基本流程为:获得图片、去噪处理、二值化处理、矫正图片、行查

找、文字定位、细化处理、文字特征扫描、查询显示文字。

OpenCv

提供了图片处理的基本函

数,例如数据矩阵的遍历,图片的存储等,去噪处理中的平滑处理、二值化处理等。矫正图片

就是将图片按照文字的行摆正,该步骤是比较的关键一步,后面的行定位等都是依赖于图片矫

正。文字的行定位和文字定位即确定文字的区域,方便文字特征扫描,细化处理是将文字细化

为一个像素,而不破坏连通性。细化处理是方便特征扫描而做的处理使数据库中存储文字特征

码和

UTF-8

编码对应起来。涉及到的相关技术主要如下。

1. OpenCv

OpenCv

是一个基于

BSD

许可发行的可以跨平台的计算机视觉库。它可以运行在

Windows

Linux

等操作系统之上,它是由一系列的

C

函数和少许的

C++

类构成,同时还提供了

Python

Matlab

等語言的接口,实现了计算机视觉和图像处理等方面的很多通用算法。

包含的五个基本模块,功能非常的强大。可以在设计中使用的是图形处理模块,结构图如

下所示:

2. UTF-8

编码

UTF-8

是一种针对

Unicode

的可变长度字符编码,又称万国码,由

Ken Thompson

1992

年创建。

UTF-8

1

6

个字节编码

Unicode

字符。在计算机内存中,统一使用

Unicode

码,当我们用记事本编辑的时候,从文件中读取的

UTF-8

字符被转换为

Unicode

字符到内存

里,编辑完成后,保存的时候再把

Unicode

转换为

UTF-8

保存到文件。

3.Flask

框架

在大多数的标准当中,

Flask

是一个小型的框架,小到可以称之为

微框架

Flask

3

主要依赖,分别为调试和

Web

服务器网关接口以及路由。子系统是由

Werkzeug

提供,模板系

统是由

Jinja2

提供,命令行集成是由

Click

提供。这些依赖全部都是由

Flask

的开发者

Armin

Ronacher

开发的。

你可能感兴趣的:(基于python的文字识别系统)