能力升级 | 古籍OCR再进一步

距离上一次古籍文字识别OCR更新已经过去了六个月，这段时间我们在不断优化OCR能力，提升在古籍图像上的文字检测和识别能力。本次更新主要有：提升语句检测和文字检测的精度、提升文字识别的准确率、字符库扩增、识别结果语序排序优化、古籍图像矫正（暂未上线）。

体验：https://www.kandianguji.com/ocr

一、提升语句检测和文字检测的精度

文字检测在整个文字识别流程中是第一步也是最主要的一步，检测的效果决定后面识别的效果，本次更新对于漏句、漏字效果有很大改善，支持的古籍图像也更加广泛，通过更精确地确定语句位置，系统能够更准确地识别文本内容，提高了整体的识别效率。

二、

字符库扩增

本次更新扩增字符库到17000+，包含常见文字、繁体字、异体字等绝大部分文字，字符库还在持续扩展中，之后的版本将支持更多中文字。

三、提升文字识别的准确率

本次更新相较于上一版本有较大改进，识别效果更精确、识别速度更快。

0.5<蓝色<0.8；红色<0.5；黑色>0.8

四、识别结果语序排序优化

本次更新对于古籍识别结果的顺序进行优化，按照从右到左，从上到下的主逻辑进行排序。

由于古籍版式更多，写法多样，结果排序目前效果还差一些，还需要进行优化完善。

五、古籍图像矫正（暂未上线）

本功能主要针对古籍扫描后倾斜，透视变换等问题进行矫正，提取图像中文本区域，进行识别，图像矫正后可以提升OCR结果语序的准确率。

本功能在内测完成后将上线，将同步新增本功能的API。

除以上更新外，本次更新对文件服务器进行升级，对OCR服务器进行升级，相较之前服务稳定性增强，访问容纳量增大。

感谢您的阅读，如果您有任何疑问、意见或建议都可以私信我们或者在我们网站提交反馈！

看典古籍

2024年4月27日