普刊论文
联系我们
全国统一QQ为:81308868、2027674726
全国统一邮箱为:youclunwen@163.com
全国统一咨询电话为:0757-63959708 ;15899573055
注册地址为:注册地址为:广东省佛山市禅城区同济西路12号永丰大厦A座1211号
服务指南
1.本站所有合作期刊均为国家正规期刊,中华人民共和国新闻出版总署网(www.gapp.gov.cn)可查。
2.本网站承诺确保稿件质量,真诚为您服务,杜绝质量差的文章,为客户创造更高的价值。与您携手,创造更美好的明天。
普刊论文

基于五官特征定位的人脸识别技术 在防盗门中的应用

发布日期:2022-10-15 11:15:00

独创声明:

本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含未获得注:如没有其他需要特别声明的,本栏可空)或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文版权使用授权书:本学位论文作者完全了解学校有关保留、使用学位论文的规定,有权保留并向国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权学校可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书摘要自动人脸识别技术(AFRT)作为一种生物特征识别技术,以其相对于其它生态所不具备的直接、方便、友好的特点,在社会安全、商贸金融等强大市场需求的推动下,已经引起越来越多研究者的兴趣,成为当今图像工程领域研究的热点。人脸是一种具有复杂的模式的非刚体,虽然人类能毫不费力地识别出人脸及其表情,但人脸的自动机器识别却是一个难度极大的课题。因此,本文首先研究了人脸自动识别技术的历史和现状及人脸识别的主要方法,然后提出了一种基于肤色及五官特征的人脸检测方法,通过对图片进行一系列的处理,提取出人脸的大致框架,然后通过眼睛、嘴巴的建模,最后得到图片中人脸的比较精确的位置。用到的关键技术包括图像数据读取、色彩空间转换、图像二值化、图像膨胀、图像腐蚀、图像建模及图像去离散点的操作等。基于K一L变换的特征脸法在人脸图像压缩和识别方面的应用,构建了人脸识别软件系统的基本框架,对给定的包含人脸的输入图像,通过与已知人脸库中存储的模型进行匹配比较,确定是否是库中某一人物,如果是,则给出最佳匹配库中人物,从而实现自动人脸识别。

关键词:人脸检测;人脸定位;特征提取;人脸识别APP!1eat1onofFaceReeogn1t1onbasedonHumanFae1alGeometryFeatures1nSeeur

1tyDoorSystemAbstraetAutomatieFaeeReeognitionTeehnology(AFRT)15oneofBiologiealeharaeteristies

ReeognitionTeehnologies.

OwingtothemeritofAFRT’smoredireetly,fr工endlyandeonvenienteharaeteristieineomParisonwithonesofBiologiealreeognitionandtheim

PellingofhugemarketingdemandsfromtheSoeialSeeurityandTrade&Finanee,ithasnowbeeomeoneoffoeusesinthefieldofImageEngineering,Faee15anon一rigidobjeetofeomPlexmodel.AlthoughhumaneaneasilyidentifyapersonfaeeandexPression,it’5averyehallengingtaskforanautomatiemaehinetodoit.Therefore,firstthehistoryandeurrentstatusoffaeereeognitionteehnologyandthemainmethodsaregiven.Then,afaeereeognitionmethodbasedonthefaeialeolorandfeatures15given:First,abroadframeworkofhumanfaee15extraetedthroughaseriesofimageProeessing.Thelast,themorePreeiseloeationofhumanfaeeinphotos15gainedbymodelingofeyesandmouth.

ThefollowingkeyteehnologiesareusedineludingImagesdatareading,eolorsPaeeeonversion,imagesoftwo一value,imagesexPansionandeorruPtion,imagesmodelingandremovingimagesseParatedPoints,ande七C.ThebasieframeworkofFaeeReeognitionsoftwaresystem15builtbytheaPPlieationinfaeeimagesex

PressandreeognitionbasedonthemethodofFaeialFeatureswithK一Leonversion.ThegivenintroduetionPieturewhiehineludethehumanfaeereeognitionteehnology

15eomParedwithandmatehknownhumanfaeemodelthatstoredinthefaeestorehouse,eonfirmingwhetherit15onePersoninthestorehouseornot,ifyes,ProvidingthebestmatehingPersoninthestorehouseeanrealizethePurPoseofhumanfaeereeognitionautomatieally.

Keyword:recogn1t1onFacedetect1onace1ocat1on;Featureextraction;Face

1、绪论

1.1人脸识别的研究

意义在计算机视觉和模式识别领域,人脸识别技术任aceReoc脚tion毛沈hnolo,gy简称FTR)是极具挑战性的课题之一,近年来,随着相关技术的飞速发展和实际需求的日益增长,它已逐渐引起越来越多研究人员的关注。人脸识别在许多领域有实际的和潜在的应用,在诸如证件检验、银行系统、军队安全、安全检查等方面都有相当广阔的应用前景。人脸识别技术用于司法领域,作为辅助手段,进行身份验证,罪犯识别等;用于商业领域,如银行信用卡的身份识别、安全识别系统等等。正是由于人脸识别有着广阔的应用前景,它才越来越成为当前模式识别和人工智能领域的一个研究热点。虽然人类能够毫不费力的识别出人脸及其表情,但是人脸的机器自动识别仍然是一个高难度的课题。它牵涉到模式识别、图像处理及生理、心理等方面的诸多知识,与指纹、视网膜、虹膜、基因、声音等其他人体生物特征识别系统相比,人脸识别系统更加友好、直接,使用者也没有心理障碍。并且通过人脸的表情/姿态分析,还能获得其他识别系统难以获得的一些信息。除上述应用外,对人脸识别的研究还具有极为重要的理论价值。人脸是自然存在的一种复杂的视觉模式,以它作为二维图像或三维非刚性物体的一种范例进行检测和识别方面的研究,必将推动图像处理、模式识别、计算机视觉等相关理论的发展。另外,人脸识别也是视觉认知心理学中的一个典型研究课题,人脸自动识别的研究一方面要借鉴对人脸识别最有帮助的人类视觉系统(Hv)s的研究成果,另一方面也会对视觉心理学中有关课题的探讨产生积极的影响和启迪。

1.2、人脸识别涉及的理论

图像是人们出生以来体验最丰富最重要的部分,图像可以以各种各样的形式出现,我们只有意识到不同种类图像的区别,才能更好的理解图像。要建立一套完整的人脸识别系统(FaceReoc加tionSystem,简称FRS),必然要综合运用以下几大学科领域的知识:

1,2.1数字图像处理

这是一门用计算机对图像数据进行加工处理的学科,它主要有以下几方面的内容:图像的数字化、图像增强、图像复原、图像的压缩编码、图像分割及图像描述等等。数字图像处理指的是用数字计算机进行图像处理。计算机硬件与软件的持续发展以及数字处理的精确性、灵活性与通用性,开辟了用数字技术进行高分辨率图像处理的道路。一方面,由于模糊数学、神经网络、小波变换、分形理论的引入,另一方面,随着可视图文、用户传真、电视会议、多媒体计算机的出现,数字图像处理技术得到了蓬勃发展.

1.2.2神经网络人工

神经网络是一门以对大脑的生理研究成果为基础,以用机器模拟大脑的某些生理与机制,实现某方面功能为目的的学科[冈.研究神经网络,特别是神经学习的机理,对认识和促进人自身发展有特殊的意义。神经网络有许多具有非线性映射能力的神经元组成,神经元之间通过权系数连接。网络的信息分布式就存在连接系数中,使网络具有很高的容错性和鲁棒性。神经网络技术已经被有效地用到组合优化、图像处理、模式识别、自动控制等方面。基于神经网络技术的人脸识别方法是人脸识别研究领域中的一大重要分支。

1.2.3模式识别模式识别

就是通过计算机用数学技术方法来研究模式的自动处理和判读。这门学科使用计算机的方法实现人的模式识别能力,即对各种事物或现象进行分析、描述、判别和识别〔-1012]。在人脸识别中,如果是个人识别,则每一个人就是一个模式,预先存在数据库里的图像就是样本;如果是性别识别、种族识别或年龄识别,则不同的性别、种族或年龄就构成一个模式;如果是表情识别,则不同的表情就是一个模式。本文重在讨论个人识别,人脸识别的最终目的就是利用人脸图像确定待识别的人究竟与数据库里的哪个人是同一个人,这是一个“是谁”的问题;或要判断这个人与库里的某个人是不是同一个人,这是一个“认识或不认识”的问题。图像识别是指对视觉图像目标按其物理特征进行分类,属于模式识别的范畴。图像识别系统的基本结构如图1一1所示。

1.2.4计算机视觉

在客观世界中,人类通过视觉识别文字和周围环境,感知外界信息。人们75%的信息量都来自视觉,因此让计算机或机器人具有视觉,是人工智能的重要环节,也是人类多年以来的梦想。在信号处理理论与高性能计算机出现后,这种希望正在逐步实现。用计算机实现对视觉信息的处理形成了一门新兴的学科一计算机视觉。计算机视觉是一门用计算机来实现人的视觉功能,实现客观三维世界的识别的学科.stl’们。计算机视觉的最终目标是模拟人类的视觉能力,理解并解释周围的世界,其研究的一个关键内容是图像的识别。1.2.5心理学和神经生理学心理学和神经学研究图像质量与识别的关系问题〔S1]。这方面的研究成果对选择什么特征做识别,或决定输入图像能取的最低分辨率,对图像识别起到一定的作用。

1.3.人脸识别的研究范围

人脸识别问题的一般性描述可以陈述如下:根据人脸数据库中所保存的己知人脸信息,来识别存在于静止图像或者视频图像序列中的一个或者多个人脸。在应用领域上,目前可能的识别任务主要可以归为两类:身份验证/证实/监O几dcfiati耐Au1Lhenticati。可suvrelilnac)e、身份识别/辨认/匹配任比cog吐tio可dIentificati。可ma1Lch)。通俗的说来,前者是判别他或她是不是某个人,而后者则是判断他或她是谁。具体地说,前者的应用情形一般是向访问者提供一个DI,同时自动验证系统获取图像,并与图像集中与此DI对应的图像相比较,从而判断此访问者是否与所提供的DI对应的个体为同一个人。典型实例就是自动门禁控制系统、银行AIM取款机、身份证件的鉴别等领域。而后者的应用情形是给出一个未知个体的图像,和己知图像集中的图像相比较,找到最相似的,从而得知个体的身份。系统给出的结果不必仅仅一个,而可以根据相似度提出一个最为匹配的图像子集。在应用上的典型实例就是公安刑侦追逃。从广义上讲,人脸自动识别的研究范围大致包括以下5个方面的内容[16](1)人脸检测任aceDetectino):即从各种不同的场景中检测出人脸的存在并确定其位置。这一任务主要受光照、噪声、面部倾斜度以及各种各样遮挡的影响。人脸检测的主要目的就是在输入的图像中寻找人脸区域,把图像分成两个部分:人脸区域和非人脸区域,从而为后续的应用做准备。(2)人脸表征(FaceReperesnattino):即采取特定的方式表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征(如欧氏距离、曲率角度)、代数特征(如矩阵特征向量)、固定特征模板、特征脸、云纹图等。人脸识别的困难首先表现在人脸模式的表达上,寻找一种稳健和精确的人脸表达方法将会极大地推动人脸识别研究。(3)人脸鉴别伊aceIdeniification)(通常所说的,“人脸识别”):即将待识别的人脸与数据库中的已知人脸比较,得出人脸之间的相关信息。这一过程的核心是选择适当的人脸表征方式与匹配策略,系统的构造与人脸的表征方式密切相关。通常是选择全局的方法或者是选择基于特征的方法进行匹配。(4)表情傻态分析伍xperssof州GesuterAnalys)si:即对待识别人脸的表情或姿态信息进行分析,并对其加以归类。到目前为止,由于该问题的复杂性对其研究还处于初步阶段。(5)生理分类少hysiaciclassification):即对待识别人脸的生理特征进行分析,得出其年龄、性别、种族、职业等相关信息。显然,这需要大量的知识,并且通常都是非常困难的。狭义上的人脸识别指的就是人脸鉴别,不过应该注意到的是,人脸鉴别的研究必须建立在人脸检测和人脸表征的基础之上,并且是息息相关的。如无特别指明,本文中的“人脸识别”就是指上述的“人脸鉴别”。

1.4、人脸识别的国内外现状

1.4.1国内现状

近年来,随着我国经济的高速发展,计算机图像识别技术越来越受到人们的重视。目前国内从事人脸识别研究的有上海交通大学的李介谷等研究基于计算机视觉场模型的人脸识别研究技术〔‘7侧,清华大学的边肇祈等从事基于KL变换的人脸识别研究【川,东南大学的程永清等从事基于统计方法,主要是奇异值分解方法的人脸识别研究【2幻,另外哈尔滨工业大学的贾小光‘.23’习和原上海工业大学的郑坚平〔阂等都在正面人像的识别方面做过工作。已开发出的图像识别系统主要有:(1)清华大学研制成功的“人脸识别系统”于2000年12月23日通过了公安部部级鉴定(2)航天金盾承担了国家“十五”科技攻关课题一人脸识别技术研究,利用课题研究的成果,并结合多年公安行业信息系统集成的经验,开发了航天金盾人脸识别系列产品;(3)由公安部标委会委员、2008年奥运会安全专家委员会委员、中科院博士马听领导的科学家攻关组,成功研制了目前国内唯一一个通过公安部检测实用的人脸识别智能化安全管理系统—猫王人脸识别系统,并获得生产许可证;(4)加05年10月香港中文大学多媒体实验室动用数百万元资金也成功开发出了“自动人脸识别系统”,标志着我国在开发人连识别技术方面已走在世界的前列。

1.4.2国外现状

国外有许多学校在研究人脸识别技术[26],研究涉及的领域很广,其中有从感知和心理学角度探索人类识别人脸机理的,如美国TexasatDallas大学的Abdi和Toole小组脚,281,由Srtil吨大学的Bucre教授和Glasgow大学的Buortn教授合作领导的小组【91z等;也有从视觉机理角度进行研究的,如英国的Gr即w小组[30,31j和荷兰〔仕。钊叮gen大学的pe伪刀v小组[321等。在用静态图像或视频图像做人脸识别的领域中,比较有影响的有M仃的Media实验室的Penilnad小组,他们主要是用基于KL变换的本征空间的特征提取法,名为“本征脸(eigenf冰e)”[33l;还有CvonderMalsb哩小组,他领导了美国的SouhtemCaliofn五a大学和德国的Boc加叨大学合作,采用动态链接结构和弹性图像匹配等方法[34];还有Ped五coetn大学cxo领导的NEc小组[35]等;从1994年开始,一些科研单位和公司开始将研究成果转移为实用产品,如Mrios公司的予山eFaee,Visinoes公司的Faeelt,ZNBoch切ntGmbH公司研制的刀协一Faec等。

1.5人脸自动识别系统

人脸自动识别系统包括三个主要技术环节,如图1一2所示,首先是人脸的检测和定位,即从输入图像中找到人脸及人脸存在的位置,并将人脸从背景中分割出来,然后才是对归一化的人脸进行特征提取及识别[36]

评价一个人脸自动识别系统的标准,一个是误识率,即将某个人错识别为他人,另一个是虚替率,即将他人识别为这个人,这二者之间是存在矛盾的,所以在实际问题中往往需要进行某种折中。人脸识别的研究已有20多年的历史,最早它和指纹识别一道作为识别罪犯身份的手段。但人脸的结构比指纹要复杂得多,并且受很多因素的干扰:人脸表情的多样性、成像过程的光照、图像的尺寸、旋转及姿势的变化等。所以至今人脸识别尚未能取得象指纹识别那样令人满意的结果。还没有通用成熟的人脸自动识别系统出现。

1.5.1人脸检测与定位

人脸检测基本思想是用知识或统计的方法对人脸建模,比较所有可能的待检测区域与人脸模型的匹配度,从而得到可能存在人脸的区域,其方法大致可以分为基于统计和基于知识两类,前者将人脸图像视为一个高维向量,从而将人脸检测问题转化为高维空间中分布信号的检测问题;而后者则利用认得知识建立若干规则,从而将人脸检测问题转化为假设/验证问题。基于统计的人脸检测方法包括事例学习方法,目前国际上普遍采用人工神经网络产生分类器。子空间学习方法,利用次元子空间漪征脸的补空间)。空间匹配滤波法,包括各种模板匹配法。基于知识建模的人脸检测方法包括器官分布规则、轮廓规则、颜色、纹理规则、运动规则和对称性等方法。

1.5.2人脸特征提取与识别

人脸识别本质上是三维塑性物体二维投影图像的匹配问题。它的困难体现在:(1)人脸塑性变形(如表情等)的不确定性;(2)人脸模式的多样性(如胡须、发型、眼镜、化妆等);(3)图像获取过程中的不确定性(如光照的强度、光源方向等)。识别人脸主要依据人脸上的特征,也就是说依据那些在不同个体之间存在较大差异而对于同一个人则比较稳定的度量。在对人脸图像进行特征提取和分类之前一般需要对图像做几何归一化和灰度归一化处理。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理。光照补偿能够一定程度地克服光照变化的影响而提高识别率[37l。其可以分为基于几何特征的方法、基于特征脸的方法、局部特征法、基于弹性模型的方法、神经网络等方法。在识别时要进行分类器的设计,其是在后台进行的,就是训练过程,此过程结束后将生成可用于分类识别的分类器。事实上,模式识别问题可以看成是一个分类问题,即把待识别的对象归到某一类中。在人像识别问题中就是把输入的不同人像归入某个人这一类。这部分的基本做法是在样本训练集基础上确定某个判决规则,使这种判决规则对被识别对象进行分类时所造成的错误识别率最小或引起的损失最小【38】。从理论上,人脸识别问题是模式识别问题的子集,所以模式识别领域的方法都可以用于人脸识别中。一个完整的人脸识别问题一般都包括人脸检测定位、人脸特征、人脸识别。有的系统还要包括人脸高层信息的分析,如性别、表情、种族等。所涉及的领域也很多,包括模式识别、计算机视觉、信号和图像处理、机器学习、统计分析、神经网络、进化计算、人类感知学等。

1.6本文所做的工作

本文主要研究了用数码相机摄入图像、人脸的检测、识别、图像数据库的建立、管理及人脸识别技术在防盗门中的应用。本文所做的工作主要是图像获取、对正面人脸图像实现了比较精确的检测、建立了彩色图像数据库并在一定程度上实现了识别,将该技术用于无钥防盗门系统,构建了防盗门系统的基本框架。具体各部分内容如下:第一部分首先介绍了人脸识别的研究意义、人脸识别涉及的理论、人脸识别的国内外现状及人脸自动识别系统等有关知识。第二部分对人脸检测方法和识别技术作了详尽全面的阐述,总结了国内外现有的几种人脸识别方法。第三部分对人脸检测的工作进行了研究,通过对图片进行一系列的处理,提取出人脸的大致框架,然后通过眼睛、嘴巴的建模,最后得到图片中人脸的比较精确的位置。用到的关键技术包括图像数据读取、色彩空间转换、图像二值化、图像膨胀、图像腐蚀、图像建模及图像去离散点的操作等。第四部分探讨了基于K一L变换的特征脸法在人脸图像压缩和识别方面的性能,构建了人脸识别软件系统的基本框架。第五部分介绍了人脸识别技术在无钥防盗门中的应用.第六部分全文总结包括本文结论和对未来工作的展望。

2、人脸识别技术

2.1人脸识别

人脸识别是图像识别的一个重要分支。影响人脸识别的因素很多,例如表情的变化、光照度的变化以及尺寸、姿态的变化等,这就增加了人脸识别的困难程度。人脸识别,首先获取人脸图像:然后经过预处理来提高图像的质量;再根据人脸检测算法来定位人脸并将人脸图像设置成预先定义的尺寸;特征提取用于抽取有效特征以降低原模式空间的维数,分类器则根据特征来做出决策分类。人类具有很强的识别人脸的能力。而设计一个自动人脸识别系统是一个非常复杂而困难的任务。造成这种困难的因素是多方面的。首先,人脸存在弹性形变,不是刚体。其次,人脸是在不同的光照、脸部表情、视觉、年龄、是否戴眼镜、是否有脸部毛发和化妆品等条件下是不同的。第三,人脸图像是一个复杂、具有非常高维数的视觉刺激,这与计算机视觉研究中使用的其它人工刺激是有很大区别的。人脸识别可以以被动的形式使用。人脸识别系统在室内和室外操作简易,可以获得在复杂背景下包含人脸模式的区域【39】人脸识别系统仅仅要求一到两个廉价的照相机,并且因其在高于人高度的位置可以捕获一个足够大的景象区域而无需移动。人脸识别设备也很容易维护,因为摄像机没有需要移动的部件。除了以上的优点,人脸识别不需要人的配合,所以能用在比较隐蔽的场所;人脸识别比起其他生物技术更为直观,更方便核查人的身份;另外,人脸图像库是国家相对于指纹等其他数据库最完整的身份资料。一个良好的人脸识别算法在眼镜片反光或眨眼的情况均可以正常工作。人脸识别是一种比较实用的生物识别方法。人脸自动识别的研究大致可以分为如下几个方面:人脸检测F(aceDe仪沦tion)从各种不同的场景中检测出人脸的存在并确定其位置;人脸表征(FaceReperesniation)即采取某种表示方式表示检测出的人脸与数据库中的已知人脸;人脸识别(Faceldentification)将已检测到的待识别的人脸与数据库中的已知人脸进行匹配,得出相关信息;表情分析(ExperssinoA习alysi)s对待识别人脸的表情信息(快乐、悲伤、恐惧、惊恐等)进行分析,并对其加以归类;生理分类(Physiaclclassfiactoin)对待识别人脸的生理特征进行分析,得出其种族、年龄、性别、职业等相关信息。

2.2人脸检测方法

人脸检测的目的是为了在一副图像上将人脸准确地分割出来。人脸检测的基本思想是用统计或知识的方法对人脸进行建模,比较所有可能的待检测区域和人脸模型的匹配度,得到可能存在的人脸。其方法大致可以分为基于统计的方法和基于知识的方法两类,前者将人脸图像作为一个高维矢量,使人脸检测转化为高维空间中分布信号的检测问题;后者利用人脸子图的空间分布知识建立若干规则,将人脸检测问题转化为假设、验证问题。

2.2.1基于统计的人脸检测方法

1、事例学习将人脸检测视为区分非人脸样本与人脸样本的两类模式分类问题,通过对人脸样本集和非人脸样本集进行学习以产生分类器。目前国际上采用较多的是人工神经网络分类器。

2、子空间方法子空间假设所有人脸模式集都在一个小的带参子空间上,这个子空间可以用数据集及其主分量求得。如果某个图像模式与该某个类的距离小于给定的门限,就可以判断该模式是人脸模式,否则不是人脸模式。Pentinad和予叮k等人将K一变换引入了人脸检测,在人脸识别中利用的是主元子空间〔特征脸),而人脸检测利用的是次元子空间漪征脸空间的补空间),用待检测区域在次元子空间上的投影能量,即待检测区域到特征脸子空间的距离作为检测统计量,距离越小,表明越像人脸。子空间方法的特点是简便易行,但由于没有利用反例样本信息,对与人脸类似的物体辨别能力不足。

3、空间匹配滤波器方法包括各种模板匹配方法、合成辨别函数方法等。

2.2.2基于知识建模的人脸检测方法

l、器官分布规则虽然人脸在外观上变化很大,但遵循一些几乎是普遍适用的规则,检测图像中是否有人脸,即是测试该图像中是否存在满足这些规则的图像块.这种方法一般有两种思路:一种是“从上到下”,其中最为简单有效的是丫川g等人提出的Moasic方法,它给出了基于人脸区域灰度分布的规则,依据这些规则对图像从粗分辨率到高分辨率进行筛选,以样本满足这些规则的程度作为检测的判据。另一种思路则是“从下至上”,先直接检测几个器官可能分布的位置,然后将这些位置点分别组合,用器官分布的几何关系准则进行筛选,找到可能存在的人脸。

2、轮廓规则人脸的轮廓可以简单的看成一个近似椭圆,而人脸检侧可以通过椭圆检测来完成。Go扒ndaraju提出认知模型方法,将人脸建模为两条直线(左右两侧面颊)和上下两个弧(头部和下巴),通过修正Houhg变换来检测直线和弧。而Tar水Su则利用凸检测的方法进行人脸检测。

3、颜色、纹理规则同民族人的面部肤色在颜色空间中的分布相对比较集中,颜色信息在一定程度上可以将人脸同大部分背景区分开来。Lee等设计了肤色模型表征人脸颜色,利用感光模型进行复杂背景下人脸及器官的检测与分割。Dai利用了SGLD(空间灰度共生矩阵)纹理图信息作为特征进行低分辨率的人脸检测.Saber等则将颜色、形状等结合在一起来进行人脸检测。

4、运动规则通常相对背景人总是在运动的,利用运动信息可以简单有效的将人从任意复杂背景中分割出来。其中包括利用瞬眼、说话等方法的活体人脸检测方法。

5、对称性规则人脸具有一定的轴对称性,各器官也具有一定的对称性。zbaordshky提出连续对称性检测方法,检测一个圆形区域的对称性,从而确定是否是人脸;Riesfeld提出广义对称变换方法检测局部对称性强的点来进行人脸器官的定位,在进行人脸器官定位时都取得了较好的效果。

2.3常用的人脸识别方法

通常,人类进行人脸识别依靠的感觉器官包括视觉、听觉、嗅觉、触觉等,通过多感官相互配合来存储和检索人脸,而计算机的人脸识别所利用的则主要是视觉数据。在计算机人脸识别中,可以将那些通过大量图像数据简单处理后获得的特征定义为低层次特征,而将线、面、模式等描述特征定义为高层次特征。由此,图像的-KL变换后的系数特征、小波变换特征及一些统计特征均属低层次特征的范畴,而人脸部件形状分析的结果则为高层次特征.由于视觉数据经传输后的重建,需依赖于人脑中早已形成的先验知识,因此,在人脸识别系统中,人脸的识别是一个整体识别和特征识别共同作用的结果。

2.3.1基于几何特征的方法

人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正巴为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以作为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种新方法。采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但凡记盯对几何特征提取的精确性进行了实验性的研究,结果不容乐观.可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即作为该器官的几何特征。这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广;二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。

2.3.2基于K一土变换的方法

Karhunen-Loeve (K-L)变换作为一种统计特征的变换,在降低冗余度上是行之有效的,通过对人脸样本集的自相关矩阵的特征矢量(eigenvector,在人脸识别中被称为eigenface的选取,构成一个正交的低维人脸空间face space),从而达到去除冗余度,提高识别率的目的。K.L变换可以从总体上有效地对识别对象(图像)进行降维。对于人脸这样一个特殊的识别对象,需要提取的是人脸样本之间方差最大的值,而对于样本个体,特征应尽量地降低冗余度。考虑到人脸固有的左右对称性,如果将人脸作为一个整体对象进行特征提取,必然影响全局特征的不相关性。因此,幻比y和丸抖。ihc提供了对称特征人脸的描述方法[40]该方法把每一幅人脸都分成一张原始人脸图像和一张镜象图像,对于原始人脸图像样本集和镜象样本集同时进行特征值计算。由于是将一张人脸分成左右两个部分,因此没有提高计算复杂性,但是通过对两部分人脸图像的有机结合,从而达到了在相同数量的前提下增加信息容量、优化识别的目的。

2.3.3基于特征脸的方法

予盯k和Pentlnad提出特征脸的方法,它根据一组人脸训练图像构造主元子空间,由于主元具有脸的形状,也称为特征脸。识别时将测试图像投影到主元子空间上,得到一组投影系数,和各个已知人的人脸图像比较进行识别。在已经进行的实验中取得了良好的识别效果。但系统在进行特征脸方法之前需要作大量预处理工作如归一化等。在传统特征脸的基础上,研究者注意到特征值大的特征向量(即特征脸)并不一定是分类性能好的方向,据此发展了多种特征仔空间)选择方法,如peng的双子空间方法,weng的线性歧义分析方法,Belhumuer的FisherFace暇方法等。事实上,特征脸方法是一种显式的主元分析人脸建模,一些线性自联想、线性压缩型BP网则为隐式的主元分析方法,它们都是把人脸表示为一些向量的加权和,这些向量是训练集叉积阵的主特征向量。总之,特征脸方法是一种简单、快速、实用的基于变换系数特征的算法,但由于它在本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与训练集比较像,所以它有着很大的局限性。

2.3.4基于局部特征的方法

主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中。同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atiek提出基于局部特征的人脸特征提取与识别方法,这种方法在实际应用取得了很好的效果。

2.3.5基于弹性模型的方法

Ladas等人针对畸变不变性的物体识别提出了动态链接模型’(DLA),将物体用稀疏图形来描述,其顶点用局部能量谱的多尺度描述来标记,边则表示拓扑连接关系并用几何距离来标记,然后应用塑性图形匹配技术来寻找最近的已知图形。Wiscott等人在此基础上作了改进,但此方法的缺点是计算量非常巨大。Nas枉甘将人脸图像建模为可变形的3D网格表面,从而将人脸匹配问题转化为可变形曲面的弹性匹配问题。利用有限元分析的方法进行曲面变形,并根据变形的情况判断两张图片是否为同一个人。这种方法的特点在于将空间和灰度放在了一个3D空间中同时考虑,实验表明识别结果明显优于特征脸方法.Lanitis等提出灵活表现模型方法,通过自动定位人脸的显著特征点将人脸编码为83个模型参数,并利用辨别分析的方法进行基于形状信息的人脸识别。

2.3.6基于神经网络的方法

目前神经网络方法在人脸识别中的研究方兴未艾。Ualentin提出一种方法,首先提取人脸的50个主元,然后用自相关神经网络将它映射到5维空间中,再用一个普通的多层感知器进行判别,对一些简单的测试图像效果较好。玩心以沉等提出了一种混合型神经网络来进行人脸识别,其中非监督神经网络用于特征提取,而监督神经网络用于分类。Lee等将人脸的特点用六条规则描述,然后根据这六条规则进行五官的定位,将五官之间的几何距离输入模糊神经网络进行识别,效果较一般的基于欧氏距离的方法有较大改善。Laurence等采用卷积神经网络方法进行人脸识别,由于卷积神经网络中集成了相邻像素之间的相关性知识,从而在一定程度上获得了对图像平移、旋转和局部变形的不变性,因此得到非常理想的识别结果。Lin等提出了基于概率决策的神经网络方法口DBN),其主要思想是采用虚拟(正反例)样本进行强化和反强化学习,从而得到较为理想的概率估计结果,并采用模块化的网络结构(OCON)加快网络的学习。这种方法在人脸检测、人脸定位和人脸识别的各个步骤上都得到了较好的应用。其它研究还有:Dai等提出用HoPfield网络进行低分辨率人脸联想与识别;Guta等提出将RBF与树型分类器结合起来进行人脸识别的混合分类器模型;PhilliPs等人将MatchingPursuit滤波器用于人脸识别。神经网络方法在人脸识别上的应用比起前述几类方法来有一定的优势,因为对人脸识别的许多规律或规则进行显性的描述是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐性表达,它的适应性更强,一般也比较容易实现。

2.3.7其他方法

Brunelii等对模板匹配方法作了大量实验,结果表明在尺度、光照、旋转角度等各种条件稳定的情况下,模板匹配的效果优于其他方法。但它对光照、旋转和表情变化比较敏感,影响了它的直接使用:Goudali等人采用局部自相关性作为人脸识别的判断依据,它具有平移不变性,在脸部表情变化时比较稳定;Larn等人研究了不同视点下的人脸匹配和识别题;、Veter等人讨论了由单幅人脸图像生成其他视点的人脸图像的可能性;Airhoses涌等则探讨了多种信息融合的人脸识别方法。

2.4人脸识别技术所面临的问题

人脸识别是生物识别技术的一种应用广泛的热点之一,是一项具有较大难度的课题。人脸识别的研究已经进行了很多年,但其进展甚微,主要的困难在于人脸可视外形的大量变化,例如人脸因其尺寸、皮肤颜色及其细节部分如眼睛、眉毛的不同而不同。此外物体与摄象机的距离和方向对其外形也有一定的影响。总的来说,困难在于视觉信息不明确。几何形状不明确的原因在于三维物体投影在二维的图片上。另外,每个像素的亮度值还依赖于环境中的各种因素。首先是光源:光源的位置、颜色和亮度;另外还有周围物体的影响,有些物体会在其他物体上投射阴影或反射一些光线。像素的亮度还取决于可视表面的反射率,光滑表面与粗糟表面反射的光线是不同的。人脸识别的困难还在于图像包括大量的数据,输入的像素可能成百上千,并且每一像素都携带了大量的信息。为了使用这些信息的全部内容,可建立一个说明分类的每种可能的输入表。但这种方法并非可行,因为描述20*20区域的分类需要256400=10963个输入,计算机的运行能力将限制分类规则的数量级。另外,在大多数的数据库中,存储的图像都是单样本人脸图像,能提取的特征信息非常有限,识别起来比较困难。

3、人脸检测

通过对图片进行一系列的处理,提取出人脸的大致框架,然后通过眼睛、嘴巴的建模,最后得到图片中人脸的比较精确的位置。用到的关键技术包括图像数据读取、色彩空间转换、图像二值化、图像膨胀、图像腐蚀、图像建模及图像去离散点的操作等。人脸检测的软件流程图如图3一1所示:

3.1人脸大致定位

所谓人脸的定位,就是在照片(静态图像)或视频(动态图像)中标出人脸所在的位置,把人脸选取出来。人脸大致定位流程图如图3一2所示:

3.1.1图像数据

读取图像数据的读取,即将图像文件读入内存。所读入内存的图像文件为BMP格式,BMP图像文件格式的图像数据是未被压缩的,图像的数字化处理主要是对图像中的各个像素进行相应的处理,而未压缩的BMP图像中的像素数值正好与实际要处理的数字图像相对应。这种格式的文件最适合对之进行数字化处理。先将BMP文件读成DBI格式,然后再显示。图像读入内存后,效果如图3一3所示:

3.1.2光线补偿

光线补偿的想法的提出主要是考虑到肤色等色彩信息经常受到光源颜色、图像采集的色彩偏差等因素的影响,而在整体上偏离本质色彩而向某一方向移动,即通常所说的色彩偏冷、偏暖、照片偏黄、偏蓝等等。系统得到的图片可能存在光线不平衡的情况,同时系统中要用到YC尤b色彩空间,有必要对图片进行光线补偿。光线补偿的思路是:(Anil K-Jain等提出)为了抵消整个图像中存在着的色彩偏差,将整个图像中所有像素的亮度从高到低进行排列,把图片中亮度最大的5%像素提取出来,然后线性放大,使得这些像素的平均亮度达到255。根据求得的系数把整个图片的亮度进行线性放大,也就是调整图片亮度的RGB值。经过光线补偿后的图片如图3-4所示。

图3一4光线补偿后的图片这一作法的合理性可以从两个角度进行考察:一方面,绝大部分的图像中都包含有纯白色,特别是包含人脸在内的图像中,在眼球外围等处通常就是纯白色,所以将具有最大亮度的像素的色彩值调整为纯白色是合理的;另一方面,存在色彩偏差的图像在原来是白色的区域有着很明显、直观的体现,所以按照这些区域的调整方法对整个图像进行调整也是比较合理和有效的。

3.1.3色彩空间

转换这是AnilK-Jain等提出的肤色模型的关键技术所在,也是构成实际利用的肤色模型的主要部分。肤色是人脸的重要信息,不依赖于面部的细节特征,对于旋转、表情等变化情况都能适用,具有相对的稳定性并且和大多数背景物体的颜色相区别。因此肤色特征在人脸检测中是最常用的一种特征。肤色特征主要由肤色模型描述。使用何种形式的肤色模型与色度空间(chromonance space)的选择密切相关.可以从两个方面考察某种色彩空间:(l)在该色彩空间中能否用给定的模型描述“肤色”区域的分布;(2)色彩空间中“肤色”与“非肤色”区域重叠的有多少。最常用的3个色彩空间分别是RGB、YCrCb、CMYK(用在彩色打印中)。所有的色彩空间都可以从RGB色彩空间转换而来。本文用的YCrCb色彩空间,YcrCb色彩空间具有如下一些优点:(1)YCrCb色彩格式具有与人类视觉感知过程相类似的构成原理。(2)YCCrb色彩格式被广泛地应用在电视显示等领域中。(3)YC尤b色彩格式具有与HIS等其他一些色彩格式相类似的将色彩中的亮度分量分离出来的优点。(4)相比HIS等其他一些色彩格式,YC汇b色彩格式的计算过程和空间坐标表示形式比较简单。(5)实验结果表明在YC汇b色彩色彩空间中肤色的聚类性比较好.在YC祀b色彩空间中,Y分量表示像素的亮度,Cr表示红色分量,Cb表示蓝色分量,通常把Cr、Cb叫做色度。YC尤b色彩空间的示意图如图3一5所示。

3.1.4非线性转换

YC汇b色彩格式直接由RGB色彩格式通过线性变换得到,其亮度分量Y并不是完全独立于色度信息而存在的,所以肤色的聚类区域也是随Y的不同而呈非线性变化的趋势。在实际的操作中发现色度值对亮度值总是存在着一定的非线性的依赖关系,这种依赖关系在很大程度上影响了图像的检测,所以本文实现的时候对YCC空间又进行了一次非线性的转换,用来消除色度对亮度的依赖关系,从结果来看,效果是不错的。实现非线性转换的公式如下所示:

其中,图(a)、(b)分别是Ycr、Ycb子空间的像素分布图,图(c)是转换后在YCC空间中的像素分布情况,图(d)是像素在C尤b子空间上的投影。

3.1.5人脸皮肤颜色建模

建模就是根据已经知道的对象特征来给对象建立一个模型,借此对对象实现判断、检测等功能。人脸建模一般可分为几何建模和色彩建模,相对而言,色彩建模的模型比较简单,而且执行速度快。实现人脸色彩建模的公式如下:

从公式可以看出,人脸建模用到的主要是YCC空间中的色度信息,建模的形式是椭圆公式匹配两个色度分量的距离。人脸皮肤建模的结果如图3一7所示。

3.1.6膨胀、腐蚀人脸图像

在生成和传输过程中受到各种噪声的干扰和影响,使图像质量下降。图像劣化的原因可以分为两类:一类是图像本身变形或模糊而劣化;一类是粗糙的障碍物附在目标图像上而劣化。后者那样的障碍物就是图像的噪声。为了抑制噪声,改善人脸图像的质量,必须消除噪声。可以采用膨胀和腐蚀的处理方法消除噪声。膨胀(dilation)是指某像素的邻域内,只要有一个白像素则该像素就由黑变为白,其他保持不变。腐蚀(erosion)是指某像素的邻域内,只要有一个黑像素则该像素就由白变为黑,其他保持不变。由于膨胀是在某种程度上消除黑像素而增加白像素,因此处理后的图像会与原图略有不同,同样腐蚀也会有此效果。膨胀、腐蚀结果如图3一8、3一9所示.

3.1.7去掉非人脸区域

定位人脸区域在图3一8中,有一些离散的区域,即非人脸区域,要将其去掉。去掉非人脸区域的图像如图3一10所示。

因为人脸皮肤建模是根据皮肤颜色来确定的,有可能把脖子肩膀等区域也包括进去,故得到的只是人脸的大致区域。当定位出人脸区域时,就可以只对区域内部的像素点进行处理,大大节省了计算时间,同时定位出这个区域,还有助于嘴巴、眼睛的定位.本系统采用递归的算法实现人脸区域的定位。人脸区域的定位如图3一11所示。图中的矩形标注区域即为计算得到的人脸区域。

3.2眼睛的定位

本文眼睛的定位是根据两个匹配来确定的,一个是亮度匹配,另一个是色度匹配。眼睛定位的流程图如图3一12所示。

3.2.1眼睛定位的流程

图3一12眼睛定位的流程图眼睛的色度匹配色度匹配就是根据已知的条件设定颜色的上下限来对眼睛进行提取操作。YCC空间中的色度操作就是对Cr、Cb分量的操作。图像的Cr、Cb分量的分布情况如图3一13、3一14所示。

眼睛的色度匹配结果如图3一15所示。

3.2.2眼睛的亮度匹配

以上内容由论文代写网-优创网整理发布,详情请浏览http://www.youclunwen.com


关于优创     |      论文代写     |      核心论文     |      普刊论文     |      英文翻译     |      合作期刊     |      支付方式     |      版权申明     |      应聘须知     |      应聘答疑
优创论文网 Copyright@2015 www.youclunwen.com All rights Reserved 版权所有
全国统一QQ为:81308868、2027674726       全国统一邮箱为:youclunwen@163.com        全国统一咨询电话为:0757-63959708 ;15899573055
优创论文网   粤ICP备2022129716号---版权所有