第六届中国厦门国际物联网博览会
中国  •  厦门
时间:2020年7月02-04日
人工智能


张腾顺:基于OCR文字识别及生物特征识别技术的人的身份与信用大数据平台

发布时间:2018-11-29

 

 和大家分享的是基于OCR文字识别技术与生物特征识别技术打造的个人身份与信用大数据平台。

 

现在我们的工作是解决政府和相关单位在办理业务时所产生的问题,在过程中会相对费时费力。主要有几方面的情况:不同机构在办理不同业务时所要提交的资料每次都需要重复提交,在提交之前也没有很明确的说所要提交的有哪些资料,所以会导致往还的办理,相关部门也要多次提醒和审核。所以整个过程对双方来讲都比较费时。其次我们在办理过程中因为同一个人办理不同业务时资料都是多次的提交、审核,在难度比较大的资料审核过程中不同部门所审核的结果会比较不一样,从而会带来审核方面的失误。很多证件材料、表单申请资料需要进行验证,每次提交都需要进行验证,这样会造成大量的工作重复。

 

基于以上的情况,我们公司会提供人的身份以及信用大数据平台解决方案。主要是通过OCR文字识别、人脸识别、实名认证从而解决各行各业证件、表格、信用文档的识别与采集工作以及分析服务。

 

目前要建立这样一套信用大数据平台,首先要解决的是大量海量证件、纸制文档、材料、办事表格的采集与录入问题,通过OCR技术可以很高效、快速地完成采集的工作,节省大量的人力成本。

 

通过OCR还可以实现对海量电子文档、图片文档进行自动分类,精确地检索,把非结构化的数据进行转化、转换,把结构化的数据录入到前端系统中,节省了人工方面的录入。

 

基于大数据平台前端对主要的是采集工作,云脉采用的OCR结合了传统文字识别技术以及现在深度学习,共同支撑平台的采集。传统的文字识别基本是采用模板匹配方式来进行,深度学习可以通过海量的数据样本,利用GPU大规模集群优势进行深度学习特征和模板的参数。这样就可以应用多类复杂背景的情况。

 

现在OCR的主要特点就是图像预处理技术有效地处理了表格的文件倾斜、阴影、压线、反光等技术。文字智能定位技术;后处理纠错技术,对图库进行后处理学习。

 

平台的第二个核心技术是人脸识别,通过人脸识别可以进行人证一致的认证,可以用于移动端的话会非常方便。另外采用活体检测,可以有效防止在人脸图像采集时的夹体攻击。

 

这是我们平台的基础架构,分为三大块:1.采集层,层级各个应用端的应用、证件、材料;2.中间层,通过OCR识别、人脸识别、第三方验证数据接口为处理层处理采集回来的图片样本;3.数据层,通过采集所有数据可以做成数据共享、数据同步、数据精确检索。

 

不同人不同业务可以一次提交一次审核,不需要重复提交重复审核、重复验证的过程。数据平台的采集来源有多方面的,1.不同业务端APP,办理不同业务时不同的部门全部都有自己的APP,通过APP前端用户自己上传完成采集工作。2.行政服务大厅,可以通过人工柜台、自助机完成采集。3.社区服务站、街道办,在办理业务时也可以进行采集工作。4.官方历史数据整理、归类,社区的人员会上门进行身份采集,把所有的证件材料进行重新识别、编制、归档。

 

归档后的所有材料、证件资料识别后进行统一的验证,可以通过在办理业务时人工验证,也可以通过官方第三方数据接口进行验证,也可以通过自己平台内部对相应的数据进行比对。

所有数据经过验证后可以在平台不形成信用分评分累计,评分的方式有非常多种,可以通过个人证件上传的完整度以及个人在行业信用数据进行加分也可以通过数据被验证后的验证度进行加分。当然同时也有扣分,如果这个人的数据以及各方面信用有相应违规、违法进行减分,个人信用分通过平台进行累计后,信用越高在办理信用过程中就更加方便、更加快捷。

 

云脉主要都在做OCR和人脸识别,所要涉及的产品种类非常多,基本属于业内领先识别率可以过98%。像护照、营业执照、名片、车牌识别率97%,也是业内领先。因为信用平台所要涉及的类型非常多,我们可以支持各种比较复杂的票据、不动产权证等材料支持。表单、表格有专门通用的文档识别,对表章可以自动建模,也可以通过深度学习把所有的模板学习特征进行更深度的学习,从而应对比较复杂的识别场景。人脸方面云脉拥有自己的自主知识产权和著作权,识别水平在业界也是比较不错的。

 

云脉公司成立了16年了,一直专注在做识别技术。目前跟众多行业合作非常多,比如说像银行、证券公司、保险、公安政府不同行业所深度合作的客户也非常多。

 

梁旭鸣先生是我们公司的董事长,从事OCR研究有二十多年了。云脉公司经过他的带领目前上市10项识别产品的著作权以及知识产权。

免费参观
合作酒店

指导单位:新华网、中国投资协会、福建省经济和信息化委员会、中国拥军优属基金会惠军工程专项基金管理委员会

主办单位:厦门市工业和信息化局、物联中国团体组织联席会

联合主办:北京物联网学会、 北京物联网智能技术应用协会、 上海市物联网行业协会、 重庆市物联网产业协会、 山东省物联网协会、 河南省物联网行业协会

湖南省物联网行业协会、 陕西物联网产业联盟、 福建省物联网行业协会、 山西省物联网产业技术联盟、 物联网创新联盟、 杭州市物联网行业协会

成都物联网产业发展联盟、 工业4.0俱乐部、 青岛市物联网协会、 无锡“感知中国”物联网商会、 珠海市物联网行业协会、 宿迁市物联网行业协会

厦门市物联网行业协会、 合肥市物联网产业协会、 台湾物联网协会、 香港物联网商会、 江西省物联网行业协会、 中国传感器与物联网产业联盟

深圳市物联网智能技术应用协会、 中国物联网产业应用联盟、宁波市物联网智能技术应用协会、 工业4.0俱乐部、 网信军民融合发展联盟智慧物联专委会

特别支持单位:华为

协办单位:阿里云

承办单位:厦门市物联网行业协会、厦门中传物联网产业开发股份有限公司

执行单位:厦门中传商务有限公司

张腾顺:基于OCR文字识别及生物特征识别技术的人的身份与信用大数据平台人工智能,媒体中心,2020中国国际物联网博览会,AI,人工智能,AI技术,
Copyright © 2018 中国国际物联网博览会    闽ICP备18006977号-1 厦门中传商务有限公司版权所有©