Xiang Li-哈尔滨理工大学

文章目录

  • 1 OCR识别文字流程
    • 1.1 滑动窗口
  • 2 数据集扩增
  • 3 上限分析

1 OCR识别文字流程

1、识别出文字区域(通过滑动窗口算法,遍历整个图片,有监督的标记训练样本特征进行判断,找到目标图片进行矩形化摘取出来)

2、对文字区域矩形分割,拆分成不同的字符(在矩形中做一维滑动窗口移动,判断字符间间距,对字符进行划分)

3、字符分类(对划分好的字符根据监督算法,对字符进行预测)

4、识别出来文字(最终识别出整个字符)

整个流程由多个任务的构成

流程图如下:

Xiang Li-哈尔滨理工大学_第1张图片

你可能感兴趣的:(深度学习入门到精通系列讲解)