全书校对使用介绍
自之前单图OCR校对功能上线之后,今天推出全书校对功能,您可以在线上传自己的古籍PDF书籍,待系统识别完成后进行在线逐页逐行逐字进行校对内容,校对完成后可以选择导出全书TXT文件、逐页JSON文件、图像文件、双层PDF文件(包含文字层,可以直接在PDF中选择和复制对应的文字)。
以下将详细介绍该功能如何使用
1、打开方式
打开【数字化】版块,在页面中间有一个表格,此表格为自己建立的数字化校对任务

2、新建校对任务,点击【新建校对任务】按钮,打开文件选择弹窗

点击【选择文件】选择本地PDF格式文件,在名称处默认为PDF文件名,可以自己输入方便自己看的任务名称,图像尺寸默认为1024,为切分PDF到图像的图像分辨率大小,图像越大,切分、识别操作较耗时,保持1024即可
3、点击【上传】按钮,触发任务建立、文件上传操作,此时可以在表格中看到刚才新建的校对任务,此时会显示【任务创建完成】


后台开始提取和识别该任务的文字信息,每隔10秒自动刷新一次进度信息

识别完成后将显示【已完成】,同时在您的账号邮箱中通过邮件通知


4、进行在线校对
操作单元格中有六个按钮,从左到右分别代表:1、开始校对;2、导出TXT;3、导出图像文件;4、导出JSON文件;5、导出双层PDF;6、删除该任务

点击第一个按钮进入校对操作

校对界面共有四个版块,除顶部第一个版块调整为页码按钮外其它操作与【单图校对】使用方法一致,可以点击顶部《使用文档》进行查看
页码中分不同颜色展示校对状态

如上图,灰色为未进行操作,绿色按钮为已进行校对操作的页码,青蓝色为当前正在操作的页码
5、导出功能
在数字化界面表格中操作列

5.1、导出TXT
点击导出TXT图标,即会导出全书txt文本文档


5.2、导出图像文件
点击导出图像图标,即会下载该pdf中每一页的图像文件

5.3、导出JSON坐标信息文件

5.4、导出双层PDF文件


即可导出带有隐藏文字层的pdf文件,以供使用
以上便是全书校对功能的详细使用介绍,若您在使用中发现问题或您有建议或其它想包含的功能,您都可以通过网站顶部【反馈】版块、网页底部【联系我们】、公众号后台私信功能向我反馈。
感谢您的使用!
看典古籍:https://www.kandianguji.com/shuzihua