OCR单图校对系统使用文档-2023.9.7

发布者:看典古籍 发布时间:2023-09-07 22:07 阅读次数:728

OCR识别的结果不准确?使用在线智能辅助校对系统修正其中的错误,得到完美结果!

在古籍数字化的过程中,会遇到图像文字无法识别、校对操作不方便等问题,市面上有大量的OCR系统,但是在古籍这个特殊领域,大部分OCR效果都不太好,对于识别结果没有一个简单好用的工具进行修改内容,想做图文对照阅读,但是有图像没有文字,有文字没有准确的坐标信息实现图文对照阅读,而现在,看典古籍正式推出《在线智能辅助校对系统》,将针对以上问题进行重点解决,提供一个简单便捷、识别准确的工具帮助您进行数字化工作。

以下为单图校对功能详细使用文档,如有意见或建议,请通过在线反馈功能向我提交反馈!

一、整体功能概览

在本工具中,顶部区域有三部分:图像上传【左】、简单介绍【中】、历史校对记录【右】,系统识别结束后会将图像显示到下面左侧区域,下面右侧区域共分为三部分:文本行数据表【上】、文本行图像【下左】、单字数据表【下右】

二、简单使用说明

一)【顶部区域】

1、上传图像

点击上传按钮上传图像,点击【开始校对】进入校对模式

2、使用说明

简单使用介绍

4、历史校对记录

每次上传校对的图像和结果会进行记录,点击校对ID打开记录继续进行校对

二)【下部区域】

3、图像

上传/点击历史校对记录会打开图像显示到此处,同时坐标信息也会绘制到此处

5、识别得到的文本行信息显示到此处,表格中显示【文字】、【操作】几个列数据

6、点击文本行/图像中的文本行区域,在此处会显示文本行的图像和图像内文字的坐标绘制信息,右侧展示图像中的字的对应

7、单字结果显示在此处,包含【文字】、【置信度】、【候选字】、【操作】几个列数据

三、详细使用说明

从一张图像上传到校对结束完整功能示例

1、上传图像(略)

2、文本行区域功能

点击【绘制】按钮,将文本行的坐标绘制到图像,点击【取消绘制】删除绘制到图像的坐标框

点击表格中的文字列或点击图像中的文字区域,将绘制改行的坐标框到图像中,并显示文本行图像及单字数据信息

编辑坐标:

点击并按住图像上坐标框的四个顶点,可以进行任意方向调整到包含文本区域

点击【添加】按钮,在图像中按住鼠标并拖动可创建一个矩形区域,按住并拖动可编辑成为四边形坐标框

当点击文本区域并高亮显示时,可以通过按下【Delete】键进行快捷删除文本行

【操作】功能说明

第一个按钮:将当前文本行向上移动一位

第二个按钮:将当前文本行移动到第一行

第三个按钮:将当前文本行向下移动一位

第四个按钮:将当前文本行移动到最后一行

第五个按钮:删除当前文本行

3、单字校对区域

左侧显示文本行图像和文字内容对照查看,点击图像中的文本坐标区域或右侧表格中文字列,可对左右数据进行高亮显示并跟踪

点击【绘制】按钮绘制单字坐标到左侧图像,点击【取消绘制】按钮清楚坐标框

中间黑色背景区域,通过多项颜色显示文字:当置信度在大于1时显示为绿色;当处于0.9-1时,显示为白色;当处于0.6-0.9时为淡橙色,当处于0.6以下时为橙色,如下图

点击表格【文字】列中的文字时,进入文字编辑模式,可以通过输入来改变当前文字

双击【候选字】列中的文字时,会替换所点击的候选字为该图像的文字

【操作】列按钮功能同上面文本行表格中的操作的功能

点击添加按钮,在图像中绘制坐标区域

新增坐标没有文字信息,点击文字坐标框,再点击【识别单字】即可识别新添加的文字并填充到表格中

4、数据处理

可以导出数据和保存已校对数据,点击保存即可保存当前进度,下次打开会接着当前的进度继续校对

点击导出TXT/JSON导出数据,TXT数据只包含文本行的文字数据,JSON数据包含文本行坐标和单字坐标

以上便是单图校对功能的详细使用方法,如有问题、意见、建议都可以通过网站的反馈功能向我提交,后续我将对一些操作不方便的地方进行优化和改进

之后将会开放全书的数字化校对功能,可以将全书通过OCR辅助进行校对,并导出全部结果,敬请期待!