机器学习/计算机视觉/文字识别

Achieve

需求
JAVA识别图片中的文字
方法一
百度 讯飞 所提供的第三方接口 Baidu
讯飞
优点:
识别率高 实现简单 识别效率高
缺点
有一定的额度限制
方法二
使用java所提供的Tess4J实现
优点:
无额度限制
缺点
识别率低 实现相对困难 识别效率低
优化方案
使用jTessBoxEditor自行训练
Tess4J入门
jTessBoxEditor自行训练

Lesson

jTessBoxEditor自行训练报错显示I/O error reading PNG header 报错原因 直接改jpg为png
解决方案 jpg图片另存为png即可

注意

直接改后缀名无法改变格式,后缀名只是人们提出来的概念,可以告诉操作系统用什么软件打开。而文件里面的内容(音频、视频)是按照一定的格式在文件里存储的,不同的文件存储的方法不一样,所以你把mkv改成MP4,但文件里的内容还是按照mkv的方法存储的实际内容,处理mp4文件的软件把它当做mp4文件的的格式去处理,就拿不到实际的内容。
tesseract zwp.test.exp0.tif zwp.test.exp0 -l chi_sim -psm 7 batch.nochop makebox报错
解决方案 将-psm 7改为–psm 7

你可能感兴趣的:(计算机视觉,java)