通用文字识别
通用文字识别是一款可将各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式进行文本识别和还原的产品。在通用全文识别能力(文字定位、行分析、文字识别)的基础上,增加了文档结构的版面分析和文档图像处理能力,进一步提升识别准确率。
产品功能
通用文字识别
通用文字识别适用于各行业场景下的非结构化文字识别,支持返回文字内容和位置坐标信息。
全文识别高精版(推荐)
全文识别高精版支持多格式版面、复杂文档背景和光照环境的精准识别,文档识别率超过99.7%。同时针对有印章、手印的文档,可实现印章擦除后识别,支持覆盖文字编辑、低置信度过滤、图案检测等高阶功能。
通用手写体识别
读光通用手写体识别模型可自动区分文字为印刷体或手写体,并采用对应的模型就行有效识别。(主要支持中文手写体、英文手写体、数字手写体等)。适用于识别各类手写笔记、板书等。
表格识别
表格识别可支持对有线表格、条纹表格、无线表格进行有效识别。
电商图文字识别
电商图文识别是专门针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别的原子能力产品,在违规广告识别、信息审核管理和网络安全治理等场景下具有极大应用价值。
防疫健康码识别
读光OCR防疫健康码识别包括全国主要省市健康码,支持姓名、更新时间、更新日期、健康码颜色、备注信息等主要字段的识别结果输出。
通信行程卡识别
读光OCR通信行程卡识别包括支付宝与微信通信大数据行程卡识别,支持行程卡颜色、更新时间、14天内到达或途经地点、存在中高风险地区的城市(如有)、电话号码等字段的识别结果输出。