如何制作属于自己的图片OCR功能

文章目录

  • 一、百度的PaddlePaddle
  • 二、一个开源软件
  • 三、 谷歌的OCR实践方案
    • 1. 安装软件包
    • 2. 安装语言包
    • 3. 运行代码
  • 三、facebook的抠图模型
  • 四、参考文献

经过本人的多次实践探索,已上线至我的网站: www.hit56.com ,可以在上面直接体验图片OCR功能
如何制作属于自己的图片OCR功能_第1张图片

一、百度的PaddlePaddle

https://github.com/PaddlePaddle/PaddleOCR

二、一个开源软件

https://github.com/DayBreak-u/chineseocr_lite

三、 谷歌的OCR实践方案

https://github.com/tesseract-ocr/tesseract在这里插入代码片

1. 安装软件包

pip install opencv-python
pip install pytesseract

2. 安装语言包

# CentOS 系统
yum install -y tesseract 
yum install -y tesseract-langpack-chi_sim
yum install -y tesseract-langpack-chi_tra
# Ubuntu 系统
apt-get install tesseract
apt-get install tesseract-ocr-chi-sim
apt-get install tesseract-ocr-chi-tra

3. 运行代码

import cv2
import sys
import pytesseract
if __name__ == '__main__':
  if len(sys.argv) < 2:
    print('Usage: python ocr_demo.py image.jpg')
    sys.exit(1)

  # 使用命令行参数
  imPath = sys.argv[1]

  # -l 识别中文
  # --oem 使用LSTM作为OCR引擎,可选值为0、1、2、3;
  #  0    Legacy engine only.
  #  1    Neural nets LSTM engine only.
  #  2    Legacy + LSTM engines.
  #  3    Default, based on what is available.
  # --psm 设置Page Segmentation模式为自动
  config = ('-l chi_sim --oem 1 --psm 3')

  im = cv2.imread(imPath, cv2.IMREAD_COLOR)

  # 进行识别,本质上是调用tesseract命令行工具
  text = pytesseract.image_to_string(im, config=config)

  # 打印结果
  print(text)

三、facebook的抠图模型

https://github.com/facebookresearch/segment-anything

四、参考文献

  • GitHub 热榜:文字识别神器,超轻量级中文 OCR!一个超级厉害的开源库 原创
  • 对比了最常见的几家开源OCR框架,我发现了最好的开源模型

你可能感兴趣的:(机器学习)