python ocr文字识别竖排繁体_繁体文字识别 ABBYY 与 千百OCR 使用比较

ABBYY是一款知名文字识别软件,识别后格式保持相对完整。由于是国外软件,不知对古书当中的繁体识别效果如何,从百度上找了一些繁体竖排的图片,然后我们将其与一款免费小软件“千百OCR”作一比较。

图一,现代印刷的仿古书籍,清晰的文本两者都能轻松识别,识别出来的字数千百ocr更多,从右到左自动改为从上到下顺序清晰。abbyy的格式显得有些混乱。

图片2,有竖线干扰的书籍

ABBYY识别效果

整体图

识别后的结果

千百OCR的识别效果(识别后点繁体转简体按钮已经转为简体)

识别后的结果(识别后点繁体转简体按钮已经转为简体,部分文字没转成功)

前言X网

婉约词是五代时期的一种词派它舍弃了一大江东去一的豪壮俊XlZ.C

而将一杨柳岸晓风残月一的旖旎风情发挥到极致柳永李清照秦

欧阳修晏殊周邦彦等多词坛名家创作了大量各具风韵的婉约词

爲婉约词的代表人物婉转柔美的词风长期影响词坛于是便形成了词

以婉约爲主流的观今

婉约词的主要特点是言情在题材内容方面多以儿女情长闺情绮

怨离愁别绪主题表现形式含蓄婉转一执手相看泪眼竟无语凝

噎柳永将恋人惜别的凄然心境描绘得淋滩尽致‘一寻寻笕笕冷冷

清清凄凄惨惨戚戚一李清照将孤苦凄凉的情绪洇染得浸入人X十

年生死两茫茫不思量自难忘苏轼

你可能感兴趣的:(python,ocr文字识别竖排繁体)