古籍PDF文件识别

{{used_count.today_used_count}}
今日已用
{{used_count.today_available_count}}
今日可用
{{used_count.thirty_days_used_count}}
近30日已用
{{used_count.thirty_days_available_count}}
近30日可用

数字化任务进度

任务名称:{{pdf_rec_task.title}}

任务ID:{{pdf_rec_task.task_id}}

总页数:{{ pdf_rec_task.pages }}

创建

{{pdf_rec_task.progress.create.date}}

PDF处理

{{pdf_rec_task.progress.pdf_process.now_page}}/{{pdf_rec_task.progress.pdf_process.pages}}

用时 {{(pdf_rec_task.progress.pdf_process.end-pdf_rec_task.progress.pdf_process.start).toFixed(2)}} 秒

{{pdf_rec_task.progress.pdf_process.error}} / {{pdf_rec_task.progress.pdf_process.pages}}

{{pdf_rec_task.progress.pdf_process.date}}

OCR识别

{{pdf_rec_task.progress.pdf_ocr.now_page}}/{{pdf_rec_task.progress.pdf_ocr.pages}}

用时 {{(pdf_rec_task.progress.pdf_ocr.end-pdf_rec_task.progress.pdf_ocr.start).toFixed(2)}} 秒

平均 {{(pdf_rec_task.progress.pdf_ocr.avg_time).toFixed(2)}} 秒/页

平均 {{(pdf_rec_task.progress.pdf_ocr.avg_time_quick).toFixed(2)}} 秒/页

预计需要 {{(pdf_rec_task.progress.pdf_ocr.estimated).toFixed(0)}} 秒

{{pdf_rec_task.progress.pdf_ocr.date}}

打包

用时 {{(pdf_rec_task.progress.result_process.end-pdf_rec_task.progress.result_process.start).toFixed(2)}} 秒

{{pdf_rec_task.progress.result_process.date}}

识别状态:{{pdf_rec_task.is_finish}}

创建时间:{{pdf_rec_task.created_on}}

结束时间:{{pdf_rec_task.finished_on}}

古籍数字化·PDF文件识别

上传PDF格式的文件进行识别,完成后下载结果文件


使用须知

1 支持单个PDF文件识别,暂不支持其它格式
2 结果文件保存2小时,请及时下载
3 识别过程中无需停留本页面,完成后返回下载即可
4 勿上传加密PDF,网站无法解密

识别结果

汇总文档(.docx)、文本文档(.txt)、格式化数据(.json 含坐标)、分页图像文件

识别额度 (额度不足?点此增加临时额度)

普通用户 500页/天 · 10000页/30天  |  会员用户 2000页/天 · 40000页/30天

单文件上限:不超过右侧今日可用额度,超出请分割后识别

温馨提示

建议绑定邮箱,识别完成后邮件通知
上传慢/卡顿?刷新页面后切换上传线路
查看《使用文档》了解详细教程

设置项解释

文本排版方向:横向/竖向/自动识别
识别版本选择:不同版本算法识别结果有差异
版面识别设置:(V2) 可排除页眉/页脚/侧边标题等
自动插入空格:(V2) 按字间距控制空格
横排文字排序:(V2) 从左到右/从右到左
竖排文字排序:(V2) 从上到下/从下到上
图像尺寸调整:建议1000-2000,0为不调整
TXT是否分页:每页一个文件 / 合并为一个文件
识别结果转简体:将识别文字转为简体中文
页内文本合并:页内文本行合并为一个段落

古籍图像识别

古籍数字化·图像文字识别

智能古籍OCR,所见即所得!上传图像即时识别


使用须知

1 支持单个图像文件识别
2 识别完成后立即删除源文件,不保存
3 结果写入右侧文本框,可编辑修改
4 请勿上传违反法律法规的文件

温馨提示

查看《使用文档》了解详细教程
机器识别结果仅可做参考使用

设置项解释

文本排版方向:横向/竖向/自动识别
识别版本选择:不同版本算法识别结果有差异
识别模式选择:行检测/字符检测(字符模式文本顺序可能错误)
图像尺寸调整:建议1000-2000,0为不调整
图像

多图像文件识别

{{used_count.today_used_count}}
今日已用
{{used_count.today_available_count}}
今日可用
{{used_count.thirty_days_used_count}}
近30日已用
{{used_count.thirty_days_available_count}}
近30日可用

数字化任务进度

任务名称:{{pdf_rec_task.title}}

任务ID:{{pdf_rec_task.task_id}}

总页数:{{ pdf_rec_task.pages }}

创建

{{pdf_rec_task.progress.create.date}}

OCR识别

{{pdf_rec_task.progress.pdf_ocr.now_page}}/{{pdf_rec_task.progress.pdf_ocr.pages}}

用时 {{(pdf_rec_task.progress.pdf_ocr.end-pdf_rec_task.progress.pdf_ocr.start).toFixed(2)}} 秒

平均 {{(pdf_rec_task.progress.pdf_ocr.avg_time).toFixed(2)}} 秒/页

平均 {{(pdf_rec_task.progress.pdf_ocr.avg_time_quick).toFixed(2)}} 秒/页

预计需要 {{(pdf_rec_task.progress.pdf_ocr.estimated).toFixed(0)}} 秒

预计需要 {{(pdf_rec_task.progress.pdf_ocr.estimated_quick).toFixed(0)}} 秒

{{pdf_rec_task.progress.pdf_ocr.date}}

打包

用时 {{(pdf_rec_task.progress.result_process.end-pdf_rec_task.progress.result_process.start).toFixed(2)}} 秒

{{pdf_rec_task.progress.result_process.date}}

识别状态:{{pdf_rec_task.is_finish}}

创建时间:{{pdf_rec_task.created_on}}

结束时间:{{pdf_rec_task.finished_on}}

古籍数字化·多图像文件识别

上传多张图像批量进行识别,完成后下载结果文件


使用须知

1 支持多个图像文件批量识别,PDF请用PDF识别
2 结果文件保存2小时,请及时下载
3 识别过程中无需停留本页面,完成后返回下载即可
4 单文件上限:不超过右侧今日可用额度,超出请分割后识别

识别结果

汇总文档(.docx)、文本文档(.txt)、格式化数据(.json 含坐标)、分页图像文件

识别额度 (额度不足?点此增加临时额度)

普通用户 500页/天 · 10000页/30天  |  会员用户 2000页/天 · 40000页/30天

温馨提示

建议绑定邮箱,识别完成后邮件通知
上传慢/卡顿?刷新页面后切换上传线路
查看《使用文档》了解详细教程

设置项解释

文本排版方向:横向/竖向/自动识别
识别版本选择:不同版本算法识别结果有差异
图像尺寸调整:建议1000-2000,0为不调整
识别结果转简体:将识别文字转为简体中文
页内文本合并:页内文本行合并为一个段落

我的API Token


{{user_token_count.today.active_count}}
今日已申请
{{user_token_count.today.today_available_count}}
今日可申请
{{user_token_count.thirty_days.active_count}}
近30日已申请
{{user_token_count.thirty_days.thirty_days_available_count}}
近30日可申请

编号 API Token 账号 备注 状态 统计(已用/共计) 操作

API Token记录


编号 操作 API Token 备注 状态 额度 申请时间 通过时间 操作

古籍数字化·古籍OCR API接口

开放API,将古籍OCR能力集成到您的应用中


API特点

1 开放REST API,兼容大部分图像格式
2 实时识别模式,随调随用
3 支持多版本算法、版面分析、坐标返回
4 可搭配OCR桌面软件和易校古籍使用

额度限制

普通用户 500次/天 · 10000次/30天

会员用户 4000次/天 · 40000次/30天

超额可付费充值(0.015元/次)

申请流程

提交申请 → 人工审核(2小时内) → 通过后即可使用

每个Token独立计费,额度不共享

名词解释

API Token:用户身份标识符,免登录调用接口
新增Token:创建新的Token身份,额度独立
状态:可用(审核通过)/ 不可用(待审核或未通过)
统计:已使用次数 / 总次数
续加额度:给指定Token免费增加可用额度
充值额度:付费充值增加Token额度
Loading...
Bootstrap Check Bootstrap