通用文字识别

[删除(380066935@qq.com或微信通知)]

更好的阅读体验请查看原文:https://help.aliyun.com/document_detail/295338.html

本章节介绍阿里云文字识别-通用文字识别系列相关产品。

产品介绍

读光通用识别类OCR识别产品,可将各类常见文档图片或文档扫描件中的文字信息按照文档原有的格式进行文本识别和还原。为了能够更好的还原文字信息和文档结构,读光文档识别在通用全文识别能力(文字定位、行分析、文字识别)的基础上,增加了文档结构的版面分析和文档图像处理能力,使得文档类图像也能按照结构化的方式进行文档元素提取,进一步提升文档识别的产品体验。

产品功能

通用文字识别

通用文字识别适用于各行业场景下的非结构化文字识别,支持返回文字内容和位置坐标信息。

通用文字识别

全文识别高精版(推荐)

全文识别高精版支持多格式版面、复杂文档背景和光照环境的精准识别,文档识别率超过99.7%。同时针对有印章、手印的文档,可实现印章擦除后识别,支持覆盖文字编辑、低置信度过滤、图案检测等高阶功能。

全文识别高精版

通用手写体识别

读光通用手写体识别模型可自动区分文字为印刷体或手写体,并采用对应的模型就行有效识别。(主要支持中文手写体、英文手写体、数字手写体等)。适用于识别各类手写笔记、板书等。

手写体

表格识别

表格识别可支持对有线表格、条纹表格、无线表格进行有效识别。

表格识别

电商图文字识别

电商图文识别是专门针对电商商品宣传图片、社区贴吧图片、网络UGC图片等网络场景下图片字符快速精准识别的原子能力产品,在违规广告识别、信息审核管理和网络安全治理等场景下具有极大应用价值。

网络电商图片

特色优势

  • 准确率高

利用海量的图片样本训练模型,具有业内领先的准确率。以身份证识别为例,准确率超过99%。

  • 实时性高

依托于阿里自建的EAS在线服务集群,精益求精优化Inference技术,提供弹性伸缩的低延时服务。

  • 技术前沿精深

基于阿里云机器学习平台PAI,应用阿里深度优化的深度学习框架PAI-Tensorflow,训练出业界领先的文本检测模型及文本识别模型。

  • 服务稳定

根据调用量提供弹性服务,扩展性好,算法持续的迭代优化对用户稳定性无影响。

应用场景

  • 图片内容审核

各类通用型接口,可针对不同场景,识别内容进行内容审核。及时发现违规行为,大大降低人力成本,广泛应用于电商内容治理场景。

  • 合同文档类识别

通用文字识别可用于识别合同、文档、小说等图片,用于合同校对、文档检索、pdf提取等场景,广泛应用于司法卷宗管理、企业法务合同审核、金融/保险自动化流程等行业。

API快捷入口

云市场API快捷入口(旧)

官网API快捷入口(新)

全文识别高精版

RecognizeAdvanced

通用手写体识别

电商图片文字识别

RecognizeBasic

表格识别

RecognizeTableOcr

通用文字识别

RecognizeGeneral