亚搏亚搏

欢迎光临
我们一直在努力

世界首份OCR白皮书出炉,根据深度学习的OCR已成干流

扫一扫就能辨认文字,这是近年来呈现在许多使用中的新功用。比方,输入银行卡号时,直接用手机摄像头扫一扫,软件就能提取银行卡信息。这儿用到的技能正是光学字符辨认技能。

OCR 是光学字符辨认的缩写,指使用机器将图画中手写体或印刷体的文本转换为核算机可以直接处理的格局。作为核算机视觉范畴的重要分支,OCR 典型使用是经过图画文字辨认完成信息录入。一起,因为文字和符号包含丰厚的语义信息,根据 OCR 提取文字信息继而进行剖析,可以协助机器更好地了解图画。

9 月 28 日,在工业和信息化部、北京市人民政府、世界电信联盟 ITU-T 辅导的 2020 AIIA 人工智能开发者大会上,主办方正式发布国内首份智能文字辨认才能测评与使用白皮书。

白皮书从 OCR 开展布景、技能沿革、工业开展现状、技能标准化、开展趋势等多个维度,对当时国内 OCR 工业进行了一次详细整理,全面助推 OCR 技能工业化加快落地及可继续开展。

据了解,白皮书由世界信息通讯研讨院、世界人工智能工业开展联盟、腾讯公司相关部分联合起草。

新基建带来新机会,OCR技能开展三大趋势

凭借人工智能技能,近年来 OCR 功用的不断提高为工业数字化催生出的更杂乱的 OCR 使用场景供应了坚实支撑。一起,掩盖手机、电子产品以及云服务在内的愈加多样化的服务载体,进一步加快了 OCR 的遍及,继续向社会生产日子的更多范畴浸透。

尤其是 2020 年 4 月,发改委清晰将人工智能根底设施列入 “新基建” 规模,作为人工智能使用中最接 “地气”,商业推行较为老练的范畴,OCR 工业在“新基建” 布景下无疑将迎来新的开展机会,相关技能也将迎来新一轮的革新。

陈述指出,OCR 技能未来开展的三大方向首要包含一体化的端到端 OCR 模型、兼具高功用高功率的 OCR、从感知到认知的智能 OCR。

详细来说,构建一体化的端到端网络,一起对文字检测和辨认进行练习,将成为 OCR 技能开展的重要趋势之一。端到端的网络规划不只可以削减重复核算,又可以进步特征的质量,促进使命功用的改进。

一起,很多的 OCR 使用需要在资源受限的移动端设备上运转,当时移动端 OCR 算法大多以献身必定的算法精度来交换运转速度,针对移动设备规划统筹功用和功率的轻量 OCR 模型将是未来开展的重要方向。

别的,从感知到认知的智能 OCR 来说,OCR 技能一般从核算机视觉范畴动身,未来与自然语言处理技能、常识图谱等更广范畴的穿插交融,经过语义及常识的深度发掘提高 OCR 功用是重要趋势。

此外,在 OCR 中引进强化学习和元学习等新的学习范式,让机器自主学习怎么辨认文字,也将成为研讨抢手。

市场规模达 133.81 亿美元,OCR 成科技巨子标配

现在,OCR 技能已在金融、稳妥、医疗、交通、教育等许多职业有了深化老练的使用。未来跟着传统职业的数字化转型,OCR 使用规模和场景将进一步扩展,市场规模将进一步增大。有权威机构猜测,2025 年全球 OCR 市场规模将到达 133.81 亿美元。

前期受限于技能开展水平,OCR 厂商一般从特定使用切入,例如车牌辨认系统等,形成了一系列专用设备。近年来,越来越多的终端设备及使用均嵌入了 OCR 技能,并逐步形成了从根底设施、根底才能到终端使用的完好工业链生态,也衍生出了卡证、收据等一系列细分 OCR 才能,经过组合的办法服务于各个职业。

图 | OCR 工业生态图

不难看出,OCR 技能逐步 “下沉” 为一项根本的才能,为上层不同的事务使用供应底层技能支撑。科技巨子和云核算厂商正在纷繁加快布局 OCR,在满意本身内部事务需求的一起,不断对外开放先进的 OCR 才能,OCR 已然成为科技巨子才能标配。

多职业场景老练落地,初次发布OCR评测标准

在详细的落地使用层面,现在卡证辨认、收据辨认等标准场景文字辨认现已相对老练,手写文字辨认在教育、物流等职业的使用也在不断扩大。杂乱动态场景下的 OCR 技能和使用成为近两年的抢手研讨方向,比方在无人驾驶、机器人等场景使用 OCR 对视场中呈现的文字进行辨认等。在此次发布的白皮书中,腾讯云也发布了其多项OCR范畴的典型落地事例。

值得一提的是,为全面下降 OCR 相关范畴的使用门槛,防止呈现鱼龙混杂局势,白皮书也初次发布 OCR 评测标准和标准。

2020 年 4 月,世界人工智能工业开展联盟拟定了《OCR 服务智能化分级技能要求和评价办法》,规则了 OCR 服务在功用、功用、安全等方面的技能要求以及评价办法。7 月,OCR 服务要求及评价办法在世界电信联盟 ITU-T SG16 组成功立项,标志着深度学习布景下的 OCR 评测办法现已逐步被世界标准安排所承受。

现在,由世界人工智能工业开展联盟辅导,腾讯云开发的天鉴 OCR 服务引擎自动化评测渠道,不只可以为 OCR 技能供应方供应技能测验服务,也将发布 OCR 技能或产品的测验成果,为需求方供应客观公平的选型根据。

赞( 108 )
未经允许不得转载: 亚搏 » 世界首份OCR白皮书出炉,根据深度学习的OCR已成干流