看典古籍·多图识别功能上线

发布者:看典古籍 发布时间:2023-11-11 18:29 阅读次数:28

看典古籍·多图识别功能上线

之前版本OCR功能只支持单张图像的识别,数字化功能只支持单PDF文件识别。现已上线多图识别功能,在【古籍数字化】版块中可以选择多张图像或单个PDF文件进行识别,识别完成后可下载每张图像的文本文件,Json文件等。

数字化功能使用说明:

您 可上传自己的古籍PDF文件或多个图像文件,待OCR识别转换完成后下载结果文件

使用说明:

1、该功能需要登录后方可使用

2、本站仅在转换过程中保存用户上传的文件,转换完成后 两小时删除文件,不会存储和使用用户上传的文件,请及时下载转换后的文件

3、不合法律法规的文件禁止上传

4、当前 仅支持PDF文件支持单个PDF文件或多个图像文件(.jpg/.png/.jpeg)的转换,其它文件格式暂不支持

5、识别转换后的内容不具有权威性,仅可做参考使用

6、转换机制采用即时处理机制 任务队列机制,若文件较大,转换时间较长,此页面将不断进行状态更新直到转换完成,您可自由选择页面刷新机制,关闭自动刷新需要您手动刷新获取页面进度

7、当前文件上传大小限制为500M 200M 100M,如需转换更大的文件,建议对文件切割后进行转换

8、转换过程中可不用停留在本页面,可继续浏览其他页面,预估转换完成后回本页面下载转换结果

9、返回结果包含:图像、TXT、JSON三个类型的文件,平均处理时间为1张/秒

10、 新识别工作完成后将收到邮件通知

多图识别功能使用方法:

一、打开网站数字化功能

访问网址:古籍数字化 (kandianguji.com)

图像

二、点击左侧选择文件按钮

图像

在弹出的文件选择窗口中按住Ctrl键通过鼠标点击多选文件或Ctrl+A键选择文件夹下所有图片文件

图像

选择完成后点击打开

图像

即可看到选择了5个文件

三、图像尺寸调整,本功能是将图像最长边等比例缩放为输入的数值,能够加快网络传输速度和识别速度,保持默认即可

四、点击【开始转换】按钮

将校验所选择的文件格式是否正确

图像

文件校验完成后将上传图像文件进行识别处理,在右侧区域可以看到基本信息,识别进度等

图像

转换完成后,进度为100%

图像

五、转换识别完成后即可下载TXT文件、Json文件、包含图像的所有结果文件

以上便是多图识别功能的具体操作方式,有任何意见、建议等都可以通过网站反馈功能/公众号私信等通道向我们反馈,感谢您的使用。

感谢阅读。

Loading...
Bootstrap Check Bootstrap