window 和 linux 安装 Tesseract-OCR

一、 Window 安装 Tesseract-OCR

1.安装 tesseract-ocr-w64-setup-5.3.1.20230401.exe

下载地址:https://digi.bib.uni-mannheim.de/tesseract/
window 和 linux 安装 Tesseract-OCR_第1张图片
2. 配置 PATH 环境变量
window 和 linux 安装 Tesseract-OCR_第2张图片
3. 配置TESSDATA_PREFIX 环境变量
window 和 linux 安装 Tesseract-OCR_第3张图片
4. 在 cmd 中查询是否安装成功
window 和 linux 安装 Tesseract-OCR_第4张图片
5. 在安装的目录 tessdata 下可以看到不同的语言包
window 和 linux 安装 Tesseract-OCR_第5张图片
如果不够用,可以去 github 上面下载自己所属的语言包
地址:https://gitcode.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator

window 和 linux 安装 Tesseract-OCR_第6张图片
6. 如果可以查询到版本号,但是使用时候还是提示查询不到系统参数 TESSDATA_PREFIX,试一下重启电脑

二、 Linux 安装 Tesseract-OCR

1.升级 gcc 版本

yum install -y centos-release-scl
yum install devtoolset-8-gcc*

替换旧的gcc

mv /usr/bin/gcc /usr/bin/gcc-4.8.5
ln -s /opt/rh/devtoolset-8/root/bin/gcc /usr/bin/gcc
mv /usr/bin/g++ /usr/bin/g++-4.8.5
ln -s /opt/rh/devtoolset-8/root/bin/g++ /usr/bin/g++

2.安装 libpng 和 libtiff

yum install libjpeg-devel libpng-devel libtiff-devel

3.下载 tesseract-ocr 压缩包

https://codeload.github.com/tesseract-ocr/tesseract/tar.gz/4.0.0

下载 leptonica 压缩包

http://www.leptonica.org/source/leptonica-1.78.0.tar.gz

4.创建目录 /usr/local/tesseract

5.安装 tesseract-ocr
将 tesseract-ocr 压缩包解压到 /usr/local/tesseract 目录下
window 和 linux 安装 Tesseract-OCR_第7张图片

进入 /usr/local/tesseract/tesseract-5.3.1
window 和 linux 安装 Tesseract-OCR_第8张图片
分别执行

./autogen.sh
./configure
make
make install

执行 ldconfig,查看是否安装成功

6.配置 tesseract-ocr 环境变量

执行 vim /etc/profile

在结尾添加配置

PATH=$PATH:/usr/local/tesseract/bin
export PATH
export TESSDATA_PREFIX=/usr/local/share/tessdata
export PATH=$PATH:$TESSDATA_PREFIX

执行以下命令使配置生效

source /etc/profile

7.查看 tesseract-ocr 的版本号

tesseract -v

window 和 linux 安装 Tesseract-OCR_第9张图片
8. 安装 leptonica

将 tesseract-ocr 压缩包解压到 /usr/local/tesseract 目录下

window 和 linux 安装 Tesseract-OCR_第10张图片

进入 /usr/local/tesseract/leptonica-1.78.0

window 和 linux 安装 Tesseract-OCR_第11张图片
分别执行

./configure
make
make install

安装 automake 和 libtool

yum install automake
yum install libtool

9.配置leptonica环境变量

执行 vim /etc/profile

在结尾添加配置

export LD_LIBRARY_PATH=/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

执行以下命令使配置生效

source /etc/profile

10.将语言包放到指定目录下
将语言包复制到 /usr/local/share/tessdata
window 和 linux 安装 Tesseract-OCR_第12张图片
window 和 linux 安装 Tesseract-OCR_第13张图片

你可能感兴趣的:(Tesseract-OCR,Tesseract)