版 面:
竖排
模 型:
基础古籍
图片支持 png、bmp、jpg、jpeg 格式,大小不超过10M。 剩余识别页数:
使用说明

尊敬的用户:感谢您体验引得识别 ,为了能让您的体验感更强,温馨提示:


一、产品简介

“引得OCR识别工具”是北京元引科技有限公司(以下简称“元引公司”)自主研发的古籍数字化系统,旨在为古籍数字化相关单位和个人提供一套强大而又简单易用的古籍数字化生产工具。平台采用了先进的深度学习算法,基于大量的古籍标注数据,从而实现了古籍文字识别的高准确率,同时提供一套基于浏览器的、简便易用的校对工具,从而有助于用户简单、高效的完成古籍数字作业。


二、识别过程
  • 主要场景:刻本图像、抄本图像
  • 语种:繁体中文
  • 版式级:竖排
  • 切分:行切分、字切分
  • 识别:真正的OCR识别,将图像信息还原成文本信息
  • 后处理:人工干预,主要集中在前几个阶段

三、影响识别准确率的关键因素
  1. 图片的质量:一般建议200dpi以上,dpi越低识别准确率越低,识别率受dpi影响较大;
  2. 颜色:一般对彩色识别很差,黑白的图片较高;
  3. 图片弯曲、阴影、摩尔纹、试卷擦除,识别率将根据严重程度而影响准确率;
  4. 最重要的就是字体,如果是手写字,识别率将受手写字的规范程度而影响准确率。

目前算力有限,只提供小规模测试和使用,如果您有大规模的使用需求,请联系我们的客服或市场人员。

如果您有其它意见或建议,也请联系我们的客服或市场人员:indexcare@ecbdb.com

识别耗时:
 
列数:
 
字数:
 
错误字数:
正确率:
 
识别结果:
完整数据: