智能客服:语音识别与自然语言处理应用
语音识别与自然语言处理等人工智能技术可以为金融机构提供在线智能客服的功能,这种功能一方面代替了人工客服,另外,在很多模式下,如电话、网页在线、微信、短信及APP中都可使用,所以推广得非常快。
金融机构通过具备人工智能的智能客服,不仅可以与客户进行语音或文本的互动交流,理解客户业务需求,语音回复客户提出的业务咨询,还能够根据客户语音导航至指定业务模块。另外,金融机构还可以对传统按键式菜单进行改造,让用户使用自然语音与系统交互功能实现菜单扁平化,提升用户满意度,减轻人工服务压力,降低运营成本。
比如交通银行推出智能网点机器人“交交”,由于电话客服不再受限于菜单,可开展全业务的语音导航服务,所以引发了银行界的广泛关注。“交交”为实体机器人,采用语音识别和人脸识别技术,人机可以进行语音交流,还可以识别熟悉客户,在网点进行客户指引、介绍银行的各类业务等。在语言交流过程中,“交交”能回答客户的各种问题,缓解等待办理业务的银行客户潜在情绪,分担大堂经理的工作,分流客户,节省客户办理时间。
平安集团则整合旗下保险、基金、银行、证券等客服渠道为95511热线,应用人工智能技术,用户拨打热线后直接说出服务需求,系统识别客户语音内容后,即可转接相应模块,大幅节省了客户选择菜单的时间。智能客服还可以进行简单问题回复,复杂问题则转人工进行支持,人机结合有效地解决了客户问题。
此外,在语音数据挖掘方面,金融公司通过人工智能技术,软件可自动将海量通话和各种用户单据内容结构化,打上各类标签,挖掘分析有价值信息,为服务与营销等提供数据与决策支持。语音语义分析还可以自动给出重点信息聚类,联想数据集合关联性,检索关键词,并汇总热词,发现最新的市场机遇和客户关注热点。同时,根据金融行业客服与客户的通话情况,可进行业务咨询热点问题梳理统计,由机器进行自动学习,梳理生成知识问答库,并作为后续机器自动回复客户问题的参考依据。
近几年来,包括工、农、建、中在内的多家银行已经通过各种措施进行网点智能化改造升级,打造注重客户体验创新型服务。让银行普通的金融终端产品有了视频互动、语音识别等智能应用。通过语音识别与自然语言处理技术形成的智慧服务模式,紧密地围绕着客户的需求,整合数据、流程以及相关系统,加快了金融与科技的快速融合,也为金融机构开展新的服务提供了新机遇。计算机可以实时语义理解,掌握客户需求,自动推送客户特征、知识库等内容,打造了完美的个人金融助理形象。
服务机器人技术:机房巡检与智慧服务
在金融机构的机房以及运营机构的大厅等核心区域,通过投放服务机器人,不仅可以及时发现处理潜在风险,替代或辅助人工进行监控,还能提升设备运营效率,并提升银行业务离柜转化率。
金融机构的机房巡检是必不可少的,但是在夏天40多摄氏度的高温现场,值班人员经常因此中暑。另外,如果人力检测,值班人员得拿手持设备对接头逐一检查,但这种测量有可能因距x不同造成结果不同。智能巡检机器人就可以发挥出无与伦比的优势。它的两只“眼睛”结合了普通的光相机和红外热成像相机。其中可见光相机可以实现远程实时监控及图像采集;红外热成像相机可实现设备红外热分析及热图采集,采集的图像数据通过云台实时传输到后台电脑,后台电脑通过人工智能计算分析出相关设备是否运转正常。
在我国银行服务过程中,柜台服务排队时间长、人工服务态度与水平参差不齐等问题长时间无法解决。由于很多银行顾客并不熟悉业务流程、也不清楚哪个自助设备能办理哪类业务,面对各种各样的自助设备有时几乎无从下手,因而不少顾客宁可在营业厅排队等上一两个小时等待柜台服务。
为了给顾客提供快速便捷的服务,提升银行营业厅的业务离柜率,很多银行开始运用机器人技术,在网点或机房投放智慧机器人,实现指定区域自动巡航功能,对客户进行迎宾分流,进行语音互动交流,根据客户知识库内容进行标准业务咨询和问答,减少大堂经理的重复性工作。同时通过前端采集客户数据,可开展精准营销工作。
如中国邮储银行最近开始在很多网店使用银行机器人“储储”,该机器人具有拟人化的的形象和相应感情和动作,其搭载了智能语音技术,有着拟人化外型,可自由移动,极富亲和力。有些顾客为了体验其功能,还成为了银行机器人的“铁杆粉丝”,每月光临网点数次。而机器人也正是把握好了这些与顾客良性互动的时机,在解答顾客咨询、与顾客友好沟通的过程中充分了解顾客需求,再据此挖掘顾客的营销价值,适时向他们推介信用卡、理财产品等金融商品或服务,为银行拓展营销空间与场景,创造新的营销价值。
银行网店的服务机器人还能够让无纸化金融和无纸化应用成为可能。服务机器人一般带有“手写电子签名系统”,顾客通过服务机器人就可以办理一些初级业务。顾客只需在机器人“面部”选择好相应的服务,并在电子触摸屏签上自己的姓名即可。未来,银行可以在机器人基础上上建立电子凭证管理系统,提供电子凭证取代纸质凭证的合规性和安全性解决方案,利用人工智能的技术进一步推动无纸化应用。
另外,以智能服务机器人为基础的智慧银行也开始在中国的一线城市建立起来。比如坐落于北京市海淀区西四环的一家智慧银行,行内分为业务办理区、自助服务区、客户体验区,设置了智能服务机器人、自助填单机、智能叫号预处理机、智能导览台、互动营销桌、微信照片打印机等各类智能设备。其中,智能服务机器人能帮助大堂经理识别引导客户,具备解答客户业务问题、引导、人脸识别功能。可根据客户语音语义,在知识库中检索相关信息,进行语音应答,带领有业务需要的客户前往相关区域通过智能终端进行业务办理。智能服务机器人在采集客户数据,开展大数据营销工作,完成查询、开卡、销卡等业务的辅助办理上已经越来越频繁。
计算机视觉与生物特征识别:人像监控与交易安全
计算机视觉与生物特征识别在金融行业中的应用越来越多。计算机视觉的直接应用是人脸识别,随着人脸识别技术的成熟,越来越多的金融商业化应用也浮出水面。尤其是银行领域,包括民生银行、农业银行、中国银行、交通银行在内的各大银行都纷纷布局人脸识别技术。
“人脸识别”自助终端是当前银行应用最为普遍的方向,比如交通银行的自助发卡机、民生银行的VTM、农业银行的超级柜台等都是将人脸识别系统引入到自助设备中,利用人脸识别技术将现场采集的照片与已存照片、身份证照片进行比对并提供人脸相似值,工作人员即可根据相似值的高低判断是否直接通过或进行人工审核。目前,用户可以在自助终端上实现自助开卡、业务变更、密码重置等个人业务,全流程电子化不仅节约时间和成本,也更加环保。不仅如此,银行工作人员也可以通过人脸识别自助终端实现一对多服务,通过客户自助办理+现场审核授权,原本只能服务一个客户的工作人员可以同时服务6-8人。
人脸识别技术在互联网金融P2P平台以及相关的APP中应用越来越广泛。比如在腾讯与公安部所属的全国公民身份证号码查询服务中心达成人像比对服务的战略合作后,微众银行的APP在工作中就可以利用人脸识别技术接入公安部查询服务中心的数据库进行对比。在微众银行开户过程中,当用户绑定两张银行卡以上时,手机应用会提醒为保证账户安全,出现通过人脸识别验证环节。而验证时,用户需要在光线合适的环境下,将脸部对准镜头后,同时跟读数字才可能通过验证。
利用人脸识别功能还能提前监控可疑人员、提示可疑行为动作,识别VIP客户。比如利用人脸识别系统,可以识别网点区域内可疑人员特征,如:是否人脸上有面罩、手持可疑物品、行动速度异常、人员倒地、人员胁迫等,还可以对客户身份进行识别。
人脸识别功能,还能起到监督和跟踪员工行为的作用,并判断员工行为是否合规及是否安全等。通过识别并标记视频监控中发现的员工可疑行为录像片段,提示后台人员进行查看,可以对一线操作人员起到心理震慑作用。通过纸文本读取技术,排查所有交易单据,建立关键字提示技术。人脸识别与语音识别相互结合,通过回访客服问答、柜台对话记录,建立风险模型,可以及时发现可疑交易。
生物特征识别则主要是通过高科技手段利用人体固有的生理特性,如指纹、人脸、虹膜等以及行为特征包括笔迹、声音、步态等进行身份鉴定。这些生物特征信息的收集主要是为了身份识别,提高风险控制水平。例如传统的办贷款流程:用户提交申请贷款机构审批贷款机构放款用户还款(机构贷后管理),用户需要在贷款机构的网点现场填写申请贷款信息,提交相关材料;贷款机构一般有信审专员人工审核贷款请求。在引入人工智能后,在申请贷款阶段用户可以利用互联网通过活体检测、人脸识别、声纹识别、OCR(光学字符识别)、指纹识别等技术录入、验证与个人相关的材料,以保证是用户本人的申请(避免欺诈行为)。对于贷款机构而言,可以利用互联网实现用户的线上申请,快速提高申请效率,拓展用户群。在信用审核阶段,机构可引入人工智能的大数据风控算法来进行自动化审批。
在生物识别技术中,人脸识别的精准度并非最高,例如指纹和虹膜就可以达到更高的精准度。在一些非常机密的区域,比如集中运营中心、数据中心机房、保险柜、金库等重要场所,金融机构可采用人脸门禁配合指纹和虹膜识别等人工智能技术,对进入人员进行验证,实现银行内部安全管理,有效地防范不法分子的非法入侵,达到安全防范的目标。
大数据:投资决策与融资授信决策
在投资决策方面,基于大数据技术的人工智能技术正在催生行业的变革,并给投资顾问领域带来了全新的视角,从而也催生了一个新的名词――智能投资顾问。花旗银行在2016年的研究报告指出,从2012年到2015年底,依赖人工智能技术的智能投资顾问管理的资产规模从0上升至290亿美元,而且其管理的财产规模还将在未来十年中呈现出几何级数的增长,预计总规模将会高达5万亿美元。目前,在发达国家中,以人工智能为基础的投资公司越来越受青睐,一些可提供资产管理服务的互联网公司已颇具规模,Wealthfront、Betterment、PersonalCapital、FutureAdvisor都是其中的佼佼者。
@些依赖人工智能技术的投资公司提供的主要是在线财富管理服务。其服务特点主要体现在可以根据现代资产组合理论,结合个人投资者的具体风险偏好与理财目标,通过后台算法与用户友好型界面相结合,利用交易所上市股票基金组建投资证券组合,并持续跟踪市场变化,在这些资产偏离目标配置的时候进行再平衡。
比如美国的Betterment设立了两个投资项,其中一个是股票组合,另一个是超安全债券组合。用户的个人银行账户与Betterment网站捆绑之后,用户可通过调整指针来调整两个投资项间的资金分配比例,调整风险的高低。
美国的另外一家公司Wealthfront则以调查问卷的形式了解用户的风险偏好,然后根据评估结果为用户量身定制投资计划。如果用户接受该计划,平台则随时监控该投资组合的动态,并定期对计划进行更新,以便合理控制风险,使之始终落在用户的容忍范围之内。目前Betterment的投资组合基于13种指数基金(ETF),其中包含了6种股票基金和7种债券基金。相比Betterment,Wealthfront的投资组合类型更加全面,包括了硬资产项目――房地产和自然资源。目前WealthFront和Betterment各自掌控着超过30亿美元的资产,是行业中规模最大的两家公司。
除了这些公司,智能投资顾问的重要性也被越来越多的传统金融机构所意识到。不久前,全球最大的基金管理公司贝莱德协议收购了FutureAdvisor,根据收购协议,这家智能投顾公司的估值达到了2亿美元。此外,美国最大的证券零售商和投资银行之一的美林证券准备引入机器人做财务顾问。据了解,该银行已经投入了部分员工使用自动化模型工具进行投资顾问服务,主要是针对25万美元以下的投资项目。
由于智能投资顾问具有速度快、精度高以及执行交易敏捷的优势,且一个智能交易程序具有同时跟踪上百只证券的能力,能实时盯盘,根据盘中申报单以及高频交易数据的状况,即时拟订最优的交易指令,并精确执行,所以各种跨金融市场、跨交易品种的交易均可以轻松地实现。如纽约公司RebellionRe-search推出首只人工智能投资基金。该公司的交易系统主要基于贝叶斯机器学习,并结合预测算法,通过响应新的外部信息和过去经验而不断自我演化,有效完成了自学习,在全球44个国家成功进行股票、债券、大宗商品和外汇等方面的交易。
其实在央行下发个人征信牌照准备通知前一天,在国务院总理的见证下,腾讯微众银行1月4日放出了第一笔3.5万元的贷款。该笔贷款就通过人脸识别技术和大数据信用评级后,计算出贷款金额。
10年前,腾讯为了发展电子商务推出网络支付品牌财付通,目前,除了互联网支付机构财付通外,腾讯还推出了微信支付及手Q支付;网络借贷也已经由腾讯参股的微众银行、财付通团队和Q钱包团队推出了微粒贷和微证券;此外,腾讯在投资或参股一些金融业务。可以说,10年来腾讯一直在互联网金融领域进行摸索和尝试,其中征信是至关重要的一环。
早在两年前,腾讯就开始进行征信业务的探索,腾讯征信有限公司是隶属于腾讯集团的征信牌照主体机构,作为独立第三方提供面向个人客户的征信产品,与包括QQ、财付通等腾讯其他部门或子公司签订协议。
目前来看,腾讯征信的产品有反欺诈产品和信用评级产品。反欺诈产品包括人脸识别和欺诈评测两个主要的应用场景。人脸识别主要应用在身份核实的相关场景,目前已应用在腾讯的微证券等产品上。欺诈评测则是对客户的欺诈风险提供一个等级评估,等级越高提示欺诈风险越大。而信用评级产品是运用于手机QQ的“7星”信用报告,亮星颗数越多代表信用越良好。
腾讯征信总经理吴丹把腾讯征信的优势总结为两点,数据和技术。“我们有很丰富的线上行为表现,我们可以拿不涉及隐私方面的数据来做用户的信用评估。在技术方面不仅有传统的统计分析的技术,也有一些新的深入学习的技术。”
我就是我,你就是你
信用风险的第一步是欺诈风险,必须先确认身份再评估其信用风险。金融机构原来的身份确认必须由审核的业务员当面验证,人脸识别身份验证提供了另外一种可能。腾讯征信的人脸识别主要包括扫描身份证、人脸识别鉴定和活体识别。
打开手机上的应用,系统通过OCR技术扫描二代身份证的正反两面,自动抓取用户身份信息;然后,用户将脸部对准屏幕上的人脸取景框,系统自动拍摄视频和照片;接着,用户面对摄像头,按照要求读出系统随机给出的一串数字。三步完成后,系统会给出摄像头前的人与身份证上是不是同一个人的判断以及评分。
据吴丹介绍,整个人脸识别的流程中,需要通过两个验证:一是生物活体检测,通过唇语和声纹等方式验证摄像头前是一个真实的人;二是人脸成像识别,把摄像头拍摄的照片、身份证照片,和公民身份证号码信息查询中心的照片进行相似度对比,判断是否同一个人。
腾讯的人脸识别技术由财付通和腾讯优图合作完成,财付通负责流程设计和金融等场景应用,优图团队负责照片比对基础技术。该项目在2014年年初提出,经过3个月推出第一个版本。此后,不断更新,今年初,总理考察微众银行看到的已经是成熟版本。
据世界人脸专业评测(LFW)评测,腾讯优图提交的在无限制条件下人脸验证测试识别准确率为99.65%,打破了之前Facebook,Google等团队创造的纪录。
腾讯优图于2012年年初成立,是隶属于腾讯社交网络事业群的技术研发团队。QQ空间的照片标注、天天P图这些腾讯体系的图片比对应用都是这个团队的成绩。腾讯优图研发中心总监黄飞跃介绍,人脸识别技术能够应用的关键核心在于三点:图像识别核心技术能力、足够庞大丰富权威的图像样本数据库和广泛灵活便捷的应用场景。
目前,腾讯征信已经和公安部所属的全国公民身份证号码查询服务中心达成人像比对服务的战略合作,可以7×24小时接入公安部查询服务中心的数据库。另外,经过数年准备,腾讯采集标注了海量生活照训练样本数据,目前拥有全球最大的黄种人人脸模型训练样本库。
腾讯优图团队每天负责处理亿级数量的图片,并自创了深度学习的模型、框架,积累了海量的数据和训练的模型。开发模型应用时,训练样本经过脱敏处理,腾讯优图不需要知道这个人叫什么名字,手机号是多少,只知道这是他可以用来识别的照片。
据了解,人脸识别服务已经进入实际应用阶段,根据实际互联网金融场景测试,自拍身份证对比可以达到万分之一错误率以下,通过率95%以上。
社交数据贡献超预期
目前,腾讯拥有8亿QQ账户、超过5亿的微信账户、超过3亿的支付用户以及其他多种服务上聚集的庞大用户。腾讯征信的数据来源,涵盖了上述用户在线、财产、消费、支付、社交、游戏等情况。
2014年,美国政策与经济研究委员会(PERC)对于非金融信息在信贷决策中作用的研究初步发现,社交信息对于判断借款人的还款意愿和能力暂无预测力。但是腾讯通过数据挖掘和实际验证认为,社交数据的有效性可能会超出预期。
“社交有没有作用,在我们这已经不是问题了。”吴丹说,
吴丹举例说,借5000元或10000元,传统上的风险评估的方法非常有用,如果只借几百块钱,大家的还款能力基本都没有问题,发生违约的情况更多是在还款意愿上,这说明从过往的还款历史或者收入情况来说,风险评估的方法不一定那么有效。“我们在模型里加入社交的因素以后,对这个数据模型有20%到25%的提升,在针对小额的模型上面,社交的作用更大,基本上大部分都是社交方面的变量。”
吴丹介绍,人脸识别技术扫描用户身份证后,腾讯征信不仅可以得到身份证本身和公安部的数据,还可以知道其在腾讯体系内的QQ、微信等信息。腾讯通过财付通的第三方支付账户和绑定的银行卡账户,把用户的身份证、QQ、微信、手机号、银行卡、财付通账户多重信息进行了关联和匹配,得到任何一种信息,都可以关联到用户的其他信息。征信体系将利用大数据平台,在不同数据源中采集处理相关行为和基础画像等数据,并利用统计学、传统机器学习的方法,形成个人征信报告。
个人征信报告主要由用户在微信、手机QQ支付以及消费偏好;在腾讯产品内各资产的构成、理财记录‘财付通账户是否实名认证和数字认证;消费贷款、信用卡、房贷是否按时还等4个维度构成。其运用于手机QQ上将采取打星的形式,共7颗星,亮星颗数越多代表信用越良好。“采取星级而不是业内普遍的评分也是基于腾讯用户的实用习惯,他们更习惯星星钻石而不是具体分数。”吴丹说。
吴丹直言:“如果我们的征信评价与央行是一致的,这说明我们的信用风险评估是准确的;如果不一致,这也是我们的价值所在――提供了另一个独特的信用评估体系。”
关键词:身份鉴别;人体生物特征;发展趋势
1.引言
信息化高速发展的一大特征是个人身份的数字化和隐性化,如何准确鉴定一个人的身份,保护信息安全是当今信息化时代必须解决得一个关键性社会问题。生物特征身份鉴别技术是身份鉴别领域的一个研究热点。生物特征识别技术是指利用人体固有的生理特征或行为特征来进行个人身份鉴别认证的技术。生物特征识别技术包括采用人体固有的生理特征(如人脸、指纹、虹膜、静脉、视网膜)进行的身份认证技术和利用后天形成的行为特征(如签名、笔迹、声音、步态)进行的身份认证技术。与传统的身份鉴定手段相比,基于生物特征识别的身份鉴定技术具有如下优点:(1)不会遗忘或丢失;(2)防伪性能好,不易伪造或被盗;(3)“随身携带”,随时随地可用。正是由于生物特征身份识别认证具有上述优点,基于生物特征的身份识别认证技术受到了各国的极大重视。
2.生物特征识别技术的现状及发展趋势
目前,常用的生物特征识别技术所用的生物特征有基于生理特征的如视网膜、人脸、指纹、虹膜,也有基于行为特征的如笔迹、声音等。下面就这些常见的生物特征识别技术的特点及其发展趋势进行讨论研究。
2.1.视网膜识别
人体的血管纹路也是具有独特性的,人的视网膜表面血管得图样可以利用光学方法透过人眼晶体来测定。用于生物识别的血管分布在神经视网膜周围,即视网膜四层细胞得最远处。如果视网膜不被损伤,从三岁起就会终身不变,如同虹膜识别技术一样,视网膜扫描可能具有最可靠,最值得信赖得生物识别技术,但它运用起来的难度较大。视网膜识别技术要求激光照射眼球的背面以获得视网膜特征得唯一性。
视网膜技术的优点:视网膜是一种及其固定得生物特征,因为它是隐藏的,故而不易磨损,老化;非接触性得;视网膜是不可见得,不会被伪造。缺点是:视网膜技术未经过任何测试,可能会给使用者带来健康的损坏。
2.2.人脸识别
人脸识别作为一种基于生理特征的身份认证技术,与目前广泛应用的以密码、IC卡为媒
介的传统身份认证技术相比,具有不易伪造、不易窃取、不会遗忘的特点;而人脸识别与指纹、虹膜、掌纹识别等生理特征识别技术相比,具有非侵犯性、采集方便等特点。因而人脸识别是一种非常自然、友好的生物特征识别认证技术。
人脸识别技术包括图像或视频中进行人脸检测、从检测出的人脸中定位眼睛位置、然后提取人脸特征、最后进行人脸比对等一系列相关的技术。
为了评测基于面部图像的人脸识别算法的性能。美国ARPA和ARL于1993年至1996年建立了FERET数据库,用于评测当时的人脸识别算法的性能。共举行了三次测试FERET94、FERET95、FERET96。FERET测试的结果指出,光照、姿态和年龄变化会严重影响人脸识别的性能。
FERET的测试结果也表明了基于面部图像的方法的缺点。人脸是一个三维非刚体,具有姿态、表情等变化,人脸图像采集过程中易受到光照、背景、采集设备的影响。这些影响会
降低人脸识别的性能。
为了克服姿态变化对人脸识别性能的影响,也为了进一步提高人脸识别性能,20世纪90年代后期,一些研究者开始采用基于3D的人脸识别算法。这些算法有的本身就采用三维描述人脸,有的则用二维图像建立三维模型,并利用三维模型生成各种光照、姿态下的合成图像,利用这些合成图像进行人脸识别。2000年后,人脸识别算法逐渐成熟,出现了商用的人脸识别系统。为了评测这些商用系统的性能,也作为FERET测试的延续,美国有关机构组织了FRVT2000、FRVT2002、FRVT2006测试。测试结果表明,人脸识别错误率在FRVT2006上下降了至少一个数量级,这种性能的提升在基于图像的人脸识别算法和基于三维的人脸识别算法上都得到体现。此外,在可控环境下,虹膜、静态人脸和三维人脸识别技术的性能是相当的。此外,FRVT2006还展现了不同光照条件下人脸识别性能的显著提高,最后,FRVT2006表明人脸自动识别的性能优于人。值得一提的是,清华大学电子工程系作为国内唯一参加FRVT2006的评测的学术机构,其人脸自动识别性能优于人类。FRVT2006为人脸识别后续的研究指明了方向,人脸识别中光照、年龄变化依然对人脸识别性能有很大影响,二维人脸识别的性能不比三维人脸识别差。
人脸识别得优点:非接触性的。缺点是:要是比较高级得摄像头才也有效地扑捉面部图像;使用者面部的位置与周围得光环境都可能影响系统的精确性,而且面部识别容易受欺骗;
对于采集图像的设备会比其他技术昂贵得多。
2.2.指纹识别
指纹识别技术是指通过比较不同人指纹中的特征点不同来区分不同人的身份。指纹识别技术通常由三个部分组成:对指纹图像进行预处理;提取特征值,并形成特征值模板;指纹特征值比对。指纹图像预处理的目的是为了减少噪声干扰的影响,以便有效提取指纹特征值。常用的预处理方法有图像增强、图像平滑、二值化、图像细化等。
特征提取的目的就是从预处理后的指纹图像中,提取出能够表达该指纹图像与众不同的特征点的过程。最初特征提取是基于图像的,从图像整体中提取出特征进行比较,但该方法的精度和性能较低。现在一般采用基于特征点的方法,从图像中提取反应指纹特性的全局特征(如纹形、模式区、核心区、三角点、纹数等)和局部特征(如终结点、分叉点、分歧点、孤立点、环点等)。得到特征点后就可以对特征点进行编码形成特征值模板。指纹特征值比对就是把当前获得的指纹特征值与存储的指纹特征值模板进行匹配,并给出相似度的过程。
指纹识别的优点:技术相对成熟;成本较低。缺点是:具有侵犯性;指纹易磨损,手指太干或太湿不易提取图像。
2.3.虹膜识别
虹膜相对而言是一个较新的生物特征。1983年,Flom与Safir申请了虹膜识别专利保护,使得虹膜识别方面的研究很少。1993年,Daugman发表了关于虹膜自动识别算法的开创性工作,奠定了世界上首个商业虹膜自动识别系统的基础。随着Flom和Safir专利在2005年的失效和CASIA及ICE2005中虹膜数据集的提供,虹膜识别算法的研究越来越蓬勃。ICE2006首次对虹膜识别算法性能进行了测试。虹膜识别中需要解决如下两个难点问题:一是虹膜图像的获取,二是实现高性能的虹膜识别算法。
3.结论
本文讨论了一些常用的生物特征识别技术的技术特点及发展趋势。随着各国对生物特征识别技术的越来越重视,生物特征识别技术必将获得更快的发展。
参考文献:
[1]张敏贵,潘泉,等.多生物特征识别[J].信息与控制,2002,31(6).
[2]杨俊,景疆.浅谈生物认证技术——指纹识别[J].计算机时代,2004,(3).
[3]侯鸿川.面部温谱图身份识别技术探讨[J].中国人民公安大学学报(自然科学版),2005,(3).
百度:AI成为头号战略无人驾驶是重中之重
三家企业中,对人工智能布局最早、投入成本最高的当数百度。百度创始人李彦宏日前在接受《财经》杂志采访时曾说:“人工智能确实会带来无穷无尽的可能性,在这方面百度目前确实也是非常领先的。如果这个机会我们能够抓住,百度可以变成一个完全不一样的公司,变成一个比现在影响力大得多的公司。”
早在2013年,百度就成立了深度学习研究院,致力于人工智能的开发,是当时国内唯一一家在深度学习方面进行大规模投入的公司。目前,百度研究院、百度大数据、百度语音和百度图像等技术都已归入人工智能技术体系。百度在人工智能领域涉猎项目众多,主攻方向有六个:深度学习平台、图像识别基本技术、细粒度图像识别、视频分析、AR技术和医院图像识别。
经过几年的发展,百度在人工智能领域共获得了超过1500项发明专利,领先于微软、IBM等老牌科技巨头。此外,百度大脑、人脸识别技术精度、语音识别能力均已达到世界顶级水平。2014年,百度在硅谷投入3亿美元打造了人工智能中心,并在硅谷大举招揽人才,中心目前已经有近200名员工。据悉,百度硅谷研发中心的一个重要使命是服务于百度无人驾驶业务。
自无人驾驶的概念在业界兴起,就有两拨力量在这一领域博弈,一为传统车企,一为高科技企业。根据自身不同的基因,它们对无人驾驶的理解和布局完全不同。传统车企的思路为无人驾驶是“装了电脑系统的汽车”,它们通常从低级的辅助驾驶开始做,希望通过不断地提升辅助驾驶的能力来达到未来完全的无人驾驶;而高科技企业对无人驾驶的理解是“装了四个轮子的电脑”,它们通常直接进行无人驾驶研发,最典型的代表是百度和谷歌。
今年8月,在深圳举办的的CCF-GAIR大会上,百度无人驾驶事业部总经理王劲说道,“百度的人工智能主要靠三个最核心的东西:一个是算法,一个是海量数据,第三个是优秀的计算能力。”
百度的无人驾驶事业部成立于2015年底,是百度目前最被寄予厚望的业务。百度今年在芜湖打造了“全无人车运营区域”,又投资了硅谷知名激光雷达公司VelodyneLiDAR,旨在降低无人车生产成本,加速无人驾驶的商业化进程。
经历了这么多前期投入,百度无人车何时能实现规模量产?王劲告诉记者:“五年后百度无人车将进行量产,届时成本会大大低于雇用驾驶员,大幅度提升交通安全及交通效率,且让人们的出行成本更低。”
腾讯:AI技术研发围绕核心业务展开
社交作为腾讯的核心业务之一,其平台和大数据等优势为人工智能技术的研发提供了更多支持,也为技术在业务上的落地应用提供了更多可能。据了解,腾讯的人工智能研发团队镶嵌在不同的事业群里,微信团队的人工智能小组主要致力于语音识别的研发,SNG(社交网络事业群)主攻人脸识别、图片识别等,搜索部门则关注自然语言识别。各部门根据自身业务需要,进行人工智能技术的开发。
在前不久举办的GAIR大会上,腾讯优图实验室总监黄飞跃接受采访,讲解了优图团队目前的主要工作。黄飞跃带领的优图团队隶属于社交网络事业群,QQ系列产品的很多功能背后都有优图团队的技术支持。优图团队的技术主要分为人脸识别、图片识别、音频识别三个部分,目前为QQ空间、QQ音乐等超过50款产品提供技术支持。具体而言,人脸识别主要用于腾讯旗下微众银行进行人证合一比对、QQ空间好友照片标记;图片识别则在微云相册、手机相册管家等图片标记管理功能中有所体现;音频识别主要应用于QQ音乐听,识曲、全民K歌等功能。这些功能主要用于提升腾讯一系列产品的用户体验,提高用户留存率。
去年6月,优图团队在国际权威人脸识别数据库LFW上以99.65%的成绩刷新世界纪录,超过了实力强劲的Linkface、Face++等新秀,以及Facebook、Google等国际巨头。目前,优图的图片识别技术已经开放给业界,通过“优图开放平台”和“腾讯云-万象优图”两个产品,开发者可以拥有顶尖团队的图片处理能力。
阿里巴巴:从小AI到ET阿里云厚积薄发
阿里布局人工智能主要集中于三方面:云计算、物联网、VR/AR。他们的战略是从业务驱动开始,逐渐加大档位。阿里选择医疗这一领域切入人工智能技术。阿里在全国各地广泛布局医疗团队,据统计,参与阿里“未来医院”计划的医疗机构已经覆盖了全国90%的省份。未来,病患只需在家附近的医院拍一张CT,就可以通过远程技术完成专家级的诊疗过程。而这种诊疗正是基于阿里云人工智能医疗系统。
2016年,随着人工智能概念不断升温,阿里加速了布局的脚步。2016年8月举办的云栖大会上,阿里云进行了品牌升级。除了换掉已使用6年的“云”字logo(商标)外,还了一款名为“ET”的人工智能机器人。
ET是四个月前的小AI的升级版,它的功能不再局限于说话聊天,而已被赋予了全局意识。基于阿里云强大的计算能力,ET目前已具备智能语音交互、图像/视频识别、交通预测、情感分析等技能。
阿里云认为,在AI大时代,大数据量背后的数学分析建模以及神经网络深度学习是发展重点。通过计算,数据之间产生了关联,从而对人类产生现实意义。ET可以在对大数据进行分析整理后,对大环境产生整体判断和把控,从而解决一些现实生活层面的应用问题。
关键词:PCA;人脸识别;算法
中图分类号:TP317.4文献标识码:A文章编号:1672-7800(2013)001-0054-03
0引言
考试仍然是当今教育体制中不可缺少的一个环节。为了更真实地反映考生的学习情况、检验教学成效,杜绝考生找“”进行替考等舞弊行为成为不容忽视的问题。身份鉴别技术是解决这一问题的关键。与传统的名字、密码等身份鉴别技术相比:生物特征识别手段的多样性,如指纹、掌纹、视网膜识别等,使之成为新兴的身份鉴别技术。由于生物特征的唯一性使得用生物特征作为身份鉴别依据的安全性、可靠性更高。在所有的生物识别技术中,指纹识别是最传统、发展最成熟的技术,但它需要被识别人主动配合,且获取识别信息需要时间,这给被识别人带来很大的不便。而人脸识别恰恰弥补了这些不足,其隐蔽性好、非接触采集和采集设备成本低等特点使之成为生物识别技术中的研究热点。人脸识别就其技术本质而言,是通过视频采集设备获取用户的面部图像,再利用核心的算法对其脸部的五官位置、脸型和角度进行计算分析,进而和自身数据库里已有的范本进行比对,最后判断出用户的真实身份。因此,采用人脸识别在考试中进行身份验证是切实可行的。利用人脸识别进行考生身份验证以代替传统的证件方式是有益的尝试。本文进行的是狭义的人脸识别研究,即将待识别的人脸与数据库中的人脸之间进行匹配的人脸鉴别。
1考试身份验证系统设计
考试身份验证系统流程框架如图1所示。在考生进入在线考试系统之前,由该系统先进行身份验证。首先由考生启动人脸识别客户端程序,驱动电脑摄像头(内置或外置)获得实时视频图像;根据捕获的视频图像定位人脸图像;经预处理来提高图像的品质,并将人脸图像设置成预先定义的尺寸;提取特征脸并在已有人脸图像数据库中进行查找、比对、识别;若能找出与客户端一致的特征脸则身份确认成功,并启动在线考试系统等待考生进入考试,否则身份确认失败,发出警报声引起监考人员警惕,考生暂不能进入考试,等待再次身份的确认(重复身份确认允许3次)。
图1考试身份验证系统流程
2基于PCA的人脸识别算法
在考试身份验证系统中,其核心实现部分就是人脸识别。人脸识别的方法很多,常用的有:几何特征识别、基于神经网络的识别、弹性图匹配的识别等。本文使用的基于PCA的人脸识别方法是基于图像灰度的统计特性,其基本原理为:利用离散KL变换提取人脸的主要成分构成特征脸库,在识别过程中将测试样本投影到该特征脸库中构成一组投影系数,通过与特征脸的距离比较,距离最小的特征脸对应的即是识别结果。在人脸识别中,若训练集是40幅不同的M×N大小的人脸图像。把图像中每一个像素看成是一维信息,则一副图像就是M×N维向量。由于人脸结构具有极大的相似性,且同一个人脸相似性更大,因此不采用像素来表达人脸,而是通过人脸来表达人脸。这就可以用PCA方法对40幅训练集图像进行处理,寻找这些图像中的相似维度。提取最重要的主成分后,让被识别图像与原图经过变化后的主元维度进行相似度比较,以衡量两幅图片的相似性。PCA人脸识别算法将训练过程重构获得的用于识别的样本称为“特征脸”,是一种通过降低维数提取特征的统计性模板比配方法对人脸进行识别的过程。PCA方法的算法如下:
第1步:将人脸图像处理为二维m×n灰度图像,并用N=m×n维列向量X表示。选取人脸图像训练样本集{Xi|i=1,…,M},其中Xi为第i个训练样本的图像向量,M为训练样本集总数。
第2步:计算训练样本的平均图像向量:μ=112M∑M12i=1Xi。
第3步:构造协方差矩阵:Ct=∑M12i=1(Xi-μ)×(Xi-μ)T。
第4步:求解协方差矩阵Ct的特征值和特征向量。直接计算的计算量比较大,采用奇异值分解(SVD)定理求解。
(1)令A=[X1-μ,X2-μ,…,XM-μ],则有Ct=AAT,通过求解ATA的特征值和特征向量获得AAT的特征值和特征向量。计算矩阵L的特征向量vl=(l=1,2,…,M)。
(2)计算出协方差矩阵Ct的特征向量μl=(l=1,2,…,M),使其满足:U=[μ1,μ2,…,μM]=[X1-μ,X2-μ,…,XM-μ]×
[v1,v2,…,vM]=AV第5步:取前d个最大特征值的特征向量计算特征脸。d由阈值θλ确定,满足:J=mind|∑d12i=1λi∑M12j=1λj>θλ3仿真实验结果及分析
一般图像的获取都是通过摄像头摄取,为了实验相对简单,不考虑通过摄像头摄取头像,而是直接给定要识别的图像。本文实验数据选自英国剑桥大学ORL人脸库。共选取40个人,每人10幅图像,图像的分辨率是112×92像素。每幅图像按列构成10304维列向量,选取每个人的前5幅图像构成一个训练集,即训练样本集数据为10304×200的矩阵,另外5幅图像构成测试集。设定阈值为0.9。
3.1实验环境
硬件配置:Intel(R)Core(TM)2DuoCPUE45002.20GHz,2GB内存。
软件:WindowsXPProfessionalSP3操作系统。利用MatlabR2010b编程实现。
3.2实验过程
第一步:读入训练样本图像,取每人(共40人)的前5幅图像,共计200幅,图像大小为112×92像素,部分人脸如图2所示。
图2部分人脸图像
第二步:对训练样本图像进行特征脸的提取。由于训练样本图像所对应的协方差矩阵为10304×10304的矩阵,直接求特征值和特征向量计算量太大,根据SVD理论求得协方差矩阵的特征值为一个1×200的向量。设定阈值为0.9,获得此时主要特征值个数为71个。将前71个主要特征值对应的特征向量组成线性变换矩阵(10304×71的矩阵):每幅训练样本图像向量进行线性变换后得到的主成分为1×71的向量,该向量经过线性变换反变换后得到的向量为1×10304,该向量构成训练图像的特征脸。特征脸示例如图3所示。
图3部分特征脸
第三步:读入剩余的图像(每人的后5幅图像)作为测试图像,40人,共计200幅,图像大小为112×92像素。将每幅测试样本图像向量进行线性变换后得到主成分为1×71的向量,该向量经过线性变换反变换后得到的向量为1×10304,该向量构成测试图像特征脸。
第四步:进行识别分类。分类器采用三阶近邻算法。最终得到的正确识别率为91.50%。三阶近邻法是计算出测试图像与训练图像距离最小的三幅图像,这三幅图像所属的类分别计为A、B、C,若A和B且B和C不属于同一类,则测试图像属于A;若A和B相同,则测试图像属于A,而B与测试图像也是相似的;若B和C属于同一类,则测试图像属于B,而C与测试图像也是相似的,但A虽然与测试图像距离最近却不属于同一类,可能是由测试图像的姿态和饰物引起的。
为测试训练人脸图像数目的多少对识别率的影响,对该40个人每人采用不同数目的人脸图像作为训练样本,得到的识别正确率如表1所示。
表1识别正确率比较
训练样本每人
图像数(幅)123124125126127128识别正确率(%)1280.001286.671291.501291.871294.171292.503.3实验结果分析
通过实验发现:PCA的识别率随着训练样本数目的增加,识别正确率逐渐提高,当超过一定训练样本数目时,识别率反而有所下降。
4总结与展望
本文通过对基于PCA的人脸识别算法的研究,得出如下结论:
(1)基于PCA的人脸识别方法算法通过降维的方法减少了计算量,降低了程序对计算机硬件的要求,同时识别的准确率较高,将该算法应用于考试身份验证中既简单又切实可行。
(2)本实验选自英国剑桥大学ORL人脸库,没有通过摄像头摄取头像,减少了考试身份验证中的图像预处理工作(包括人脸图像的定位、去噪等),该工作是完善考试身份验证系统中不可缺少的一部分。下一步工作拟采用VC++6.0作为工具平台,实现一个完整考试身份验证系统。
(3)传统PCA方法在处理人脸图像时,要将二维图像矩阵转换成一维的列向量,使图像的维数达到上万维,计算工作量大,特征提取速度慢。针对PCA算法的不足,有研究者提出了改进的PCA算法,例如:核主分量分析法(KPCA,KernelPrincipalComponentAnalysis)、二维主分量分析法(2DPCA,TwoDimensionalPrincipalComponentAnalysis)等,下一步有待在这些方面做进一步探索。
参考文献:
[1]李盛文,鲍苏苏.基于PCA+AdaBoost算法的人脸识别技术[J].计算机工程与应用,2010(4).
[2]郑晓薇,于梦玲.基于Matlab多核集群的人脸识别算法的并行化设计[J].计算机应用,2011(10).
[3]张俭鸽,刘洪波.WTPCA和三阶近邻的人脸识别算法仿真[J].计算机工程与应用,2009(11).
[4]王映辉.人脸识别原理方法技术[M].北京:科学出版社,2010.
[5]孙强,叶玉堂,邢同举,等.基于主成分分析法的人脸识别的探讨与研究[J].电子设计工程,2011(20).
[6]张俊虎,郝晓剑,邢昊.人脸图像识别中的PCA算法实现[J].微计算机信息,2010(19).
[7]于世华,杜福涛.基于人脸识别的上机辅助身份验证系统设计与实现[J].呼伦贝尔大学学报,2009(1).
[8]张成功.自动人脸识别在网上考试系统中的应用[J].大同大学学报:自然科学版,2009(3).
[9]马桂英.人脸识别技术的应用及研究趋势[J].福建电脑,2009(10).
[10]章品正,王征,赵宏玉.面部表情特征抽取的研究进展[J].计算机工程与应用,2006(9).
[11]刘艳丽,赵跃龙.人脸识别技术研究进展[J].计算机工程,2005(3).
[12]刘露.识别人脸的技术[J].百科知识,2007(2).
“芝麻,开门吧!”这充满魔力的咒语,总能让人想起阿里巴巴与四十大盗的故事。强盗们保护财宝的方法神秘莫测,常令人满怀好奇。2008年8月8日,用于维护北京奥运会安全的人脸识别系统,在万众瞩目的中国国家体育场鸟巢上演了一场现代版的芝麻开门,吸引了全世界的目光。
据悉,人脸识别查询技术是由清华大学电子工程系承担的一项国家“十五”科技攻关课题。目前,该系统已建成拥有256万张人脸图像的人脸识别数据库,识别速度达到每秒256万张,即一张人脸图像在一秒钟内可以和256万张人脸――比对,轻松完成“你到底是谁”的核查。这一卓越成果的问世,让我们对它的开发者――我国著名图像处理系统专家、清华大学教授苏光大产生了浓厚的兴趣。
兢兢业业写春秋
早在1989年,苏光大教授带领课题组接受了公安部计算机人像组合系统的研制任务。1992年,研制成果通过公安部组织的专家鉴定,1993年由公安部组织推广应用。1994年。武汉市公安局利用这一技术破获了武汉持枪抢劫的特大案件,成为人像组合破获的首起成功案例,中央电视台《东方时空》等栏目及时进行了追踪报道。此后,课题组将人脸识别技术作为科研方向,付出了极大的努力。1996年,他们又承担了公安部的人像组合与人像识别综合系统科研课题。2000年12月,由他们研制成功的系统通过了公安部组织的专家鉴定。2004年,北京市公安局利用这一系统破获了著名的北京超市系列投毒案,为维护社会安全做出了突出贡献。
作为关键技术之一,人脸识别技术在防范打击重大刑事犯罪中发挥了不可替代的重要作用,因此,公安部将该技术的研究列入国家“十五”攻关计划。由于具有良好的专业素质和多年的实践经验,苏光大教授带领他的团队接受了这一科研重任。此后,他们沉醉于课题攻关中,不舍昼夜地拼搏。2005年1月,由他们研制成功的人脸识别系统通过成果鉴定。并于2006年1月参加了科技创新重大成就展,获得了有关领导和专家的好评。不久,新华社、中新社根据“清华人脸综合识别系统全面进入应用推广”的新闻稿发了通稿,上百家媒体相继进行了集中报道,不仅在国内外产生了较大影响,更推动了国内的人脸识别市场。由此,清华大学人脸识别系统成为国内应用的主流系统之一,在公安、安全部门广泛应用。2008年1月,他们在国内首次建成了千万级数据库的人脸识别应用系统,取得了突出的应用成果。
特别值得一提的是,2005年,苏光大教授发表了人脸识别与奥运的学术论文,表达了服务北京奥运会的愿望,并根据奥运会应用的特点,在已有MMP-PCA人脸识别算法的基础上,研制成功了GGMMP-PCA人脸识别新算法。这一研究成果于2008年发表在国际顶级的计算机视觉和模式识别会议CVPR上。经过多方努力,他们研发的系统在2007年8月、2008年5月两次参加奥运测试赛,并最终应用在北京奥运会、残奥会的开幕式和闭幕式上。由苏光大教授带领的清华大学课题组与北京普赛科技有限公司以及中科院自动化所、北京数字奥森公司和航天长峰集团、同方股份有限公司等单位通力合作,共同完成了这一具有历史意义的工作,开创了人脸识别技术应用于奥运会的先河。
“泰山不让土壤,故能成其大;河海不择细流。故能就其深。”苏光大深谙厚积薄发之道,带领团队兢兢业业,书写了我国人脸识别技术领域的精彩篇章!
风雨磨砺塑英才
回顾走过的道路,苏教授收获了累累硕果,更经历了无数风雨的磨砺。上世纪70年代,国内的图像处理技术研究刚刚开始,作为较早从事相关研究的科研人员之一,苏光大教授所在的团队面临着诸多困难。当时,国外的处理系统价格昂贵,国内根本买不起,只能自己研制。然而,国产器件质量不过关,他们在工艺上还需要一点点摸索,其艰辛可想而知。尽管条件有限,他们却没有放弃,而是选择了迎难而上,潜心钻研,在摸索中前进。1981年,中国较早的图像处理系统“TS-79小型通用数字图像处理系统”研制成功。其后,他们也引进过国外的器件,所开发的系统比国外的同类系统性能优越得多。一次次的成功给了他们巨大的信心。1985年,他们参与研制的“TS-84微机图像图形处理系统”获得成功,成为中国最早的微机图像处理系统,并于1988年荣获北京市科技进步二等奖。
“没有人能够随随便便成功”,事实的确如此,在苏教授的辉煌成果背后是无尽的艰辛与付出。工作起来,不分白天、黑夜,没有节假日,没有所谓的休息、锻炼,不知道看电视的乐趣,不知道唱卡拉OK的畅快,日日往返于实验室、食堂、家这三点一线之间,苏教授是这样的人,他的学生也是这样的人。他常常劝诫年轻人“业精于勤”,引导他们趁着年轻努力奋斗,书写多彩人生。学生们还清楚记得这样一件事。有一次,苏教授不慎被刚烧开的一壶水烫伤了双脚,他硬是不顾烫伤,用塑料袋裹住双脚,顶着大雨,坚持到实验室加班。这份于科研的情意,这份于事业的执著曾让他们深深震撼!苏教授在给毕业生的留言中这样写道:“抓住思想的火花,倾注创作的激情,百折不挠的努力,有声有色的体现。”这不仅成为学子们人生的座右铭,更被收入《中国名人格言》中,为更多人带去人生的启迪。
在2006年的科技创新重大成就展上,当时的科技部部长对苏光大教授和清华大学团队取得的成就大加赞赏。并询问项目的经费是多少,苏教授笑着回答:“国家拨款50万。”
是啊,这样的经费创造出这样的成果怎能不令人刮目相看。他开玩笑地说:“给我阳光,我就‘灿烂’。”当初人像组合系统仅一万多元的项目经费,他也为国家做出了令人惊奇的成果。苏教授说:“国家的事儿,没有大小之分,都是重要的事情。只要国家把任务交给了我们,我们就一定要做好!”在他心中,只要是国家需要的科研项目,他们都会殚精竭虑努力做到最好。
“苏教授,您的人脸识别系统又帮我们破了大案,我们对您表示感谢啊!”这样的电话苏教授已经司空见惯。每当这时,那些曾经的艰辛与付出他早都忘到了九霄云外,满心满脑子都是自己为维护国家安全和社会治安又尽了一份力,心中洋溢着无尽的喜悦与幸福。
“从明天起,和每一个亲人通信/告诉他们我的幸福/那幸福的闪电告诉我的/我将告诉每一个人。”谈起科研工作中的新发现,苏教授欣喜之情溢于言表,告诉我们他的心情就像海子在这诗中写的一样,他总是愿意和更多的人分享自己的喜悦,在不断地交流中更快地成长和进步。也许,正是这样的心态,成就了我们面前的这位图像处理专家。