OCR文档识别——数据录入工厂

数据录入工厂特色
识别核心
软件内置文通科技最新研发的高性能文字识别引擎,支持中英日韩四国文字以及对英文的混排,识别率达99.8%以上。
Unicode编码
采用UNICODE国际编码标准。系统可在一个统一的平台下,同时处理包括中文、日文、韩文、英文在内的多种文字的识别和校对修改。
校对方式灵活准确
在横向校对的基础上,提供纵向校对进行校对辅助,尽可能的让校对高效率,文字正确率更高
导出格式多样灵活,支持PDF、TXT、WORD、XLS等格式
多种应用模式:该软件即可独立作为数据加工软件使用,也可以针对档案、文档、全文检索系统做接口;
脱机批量导入:该软件配套的Image To PDF的批量识别转换功能,可以实现自动监视文件夹,并直接对导入文件批量识别转换问pdf格式的文件,适应无人操作工作模式。
集字校对器:该软件配套的集字校对器,可以实现集字校对(即纵向校对)的模式,改变传统的校对模式,避免校对人员陷入文字情节中,增加了校对正确率。
画框识别:功能允许用户只识别手工编辑修改过的或新增加的区域,而保留其他已经完成校对的文字区域,为用户使用提供最大的灵活性与方便性。
自学功能:针对古籍、科研等特殊领域文档中经常出现的特殊文字,即使不在国家标准范围以内或者TH-OCR字库中并没有支持,用户也可通过自学习功能,将这些文字的图像学习进入系统,使得调整后的核心可以支持这些文字的识别。 
版面还原:强大的版面还原技术,可将识别后的报刊、杂志、图书等多种形式的文档,通过还原字体、字号、版面位置、字体颜色等信息以原版原式呈现在读者面前,最终生成优质的全息PDF文档。<

你可能感兴趣的:(OCR识别)