全书校对使用介绍

发布者:看典古籍 发布时间:2023-09-25 22:08 阅读次数:28

全书校对使用介绍

自之前单图OCR校对功能上线之后,今天推出全书校对功能,您可以在线上传自己的古籍PDF书籍,待系统识别完成后进行在线逐页逐行逐字进行校对内容,校对完成后可以选择导出全书TXT文件、逐页JSON文件、图像文件、双层PDF文件(包含文字层,可以直接在PDF中选择和复制对应的文字)。

以下将详细介绍该功能如何使用

1、打开方式

打开【数字化】版块,在页面中间有一个表格,此表格为自己建立的数字化校对任务

图像

2、新建校对任务,点击【新建校对任务】按钮,打开文件选择弹窗

图像

点击【选择文件】选择本地PDF格式文件,在名称处默认为PDF文件名,可以自己输入方便自己看的任务名称,图像尺寸默认为1024,为切分PDF到图像的图像分辨率大小,图像越大,切分、识别操作较耗时,保持1024即可

3、点击【上传】按钮,触发任务建立、文件上传操作,此时可以在表格中看到刚才新建的校对任务,此时会显示【任务创建完成】

图像

图像

后台开始提取和识别该任务的文字信息,每隔10秒自动刷新一次进度信息

图像

识别完成后将显示【已完成】,同时在您的账号邮箱中通过邮件通知

图像

图像

4、进行在线校对

操作单元格中有六个按钮,从左到右分别代表:1、开始校对;2、导出TXT;3、导出图像文件;4、导出JSON文件;5、导出双层PDF;6、删除该任务

图像

点击第一个按钮进入校对操作

图像

校对界面共有四个版块,除顶部第一个版块调整为页码按钮外其它操作与【单图校对】使用方法一致,可以点击顶部《使用文档》进行查看

页码中分不同颜色展示校对状态

图像

如上图,灰色为未进行操作,绿色按钮为已进行校对操作的页码,青蓝色为当前正在操作的页码

5、导出功能

在数字化界面表格中操作列

图像

5.1、导出TXT

点击导出TXT图标,即会导出全书txt文本文档

图像

图像

5.2、导出图像文件

点击导出图像图标,即会下载该pdf中每一页的图像文件

图像

5.3、导出JSON坐标信息文件

图像

5.4、导出双层PDF文件

图像

图像

即可导出带有隐藏文字层的pdf文件,以供使用

以上便是全书校对功能的详细使用介绍,若您在使用中发现问题或您有建议或其它想包含的功能,您都可以通过网站顶部【反馈】版块、网页底部【联系我们】、公众号后台私信功能向我反馈。

感谢您的使用!

看典古籍:https://www.kandianguji.com/shuzihua

Loading...
Bootstrap Check Bootstrap