- 易迪拓培训,专注于微波、射频、天线设计工程师的培养
基于几何匹配和分合算法的人脸识别-毕业论文
目前在人脸定位领域,几何模型匹配方法得到了广泛的使用。
本文对几何模型匹配方法进行了研究,提出了一套完整的人脸定位算法。在预处理部分,采用了特别的增强人脸特征与脸部皮肤之间对比度的方法及局域取阈值二值化方法,改进了预处理的效果。在图像分割部分,实现了经典的分合算法,并且使用成组算法改进了分合的效果。在人脸匹配部分,实现了基于眼睛和嘴的几何模型匹配,并对评价函数的构造进行了研究。
在Microsoft Windows 98平台上Borland Delphi 3.0开发环境下,采用上述算法编制了人脸定位的软件。实验证明,该软件对于尺寸足够大的清晰的正面单个/多个人脸情形能够正确检测定位,典型耗时为3~40秒钟。
最后,本文探讨了几何匹配算法和分合算法的优缺点,提出了进一步工作的方向。
关键词:人脸定位,几何匹配,分合算法,二值化,图像分割,成组算法,评价函数。
Abstract
In the area of human face locating, methods using a geometric face model(geometrical matching) are widely used.
This paper studied a method of geometrical matching and presented a complete set of algorithms for human face locating. In the section of preprocessing, special methods to enhance the contrast between face features and face skin and a local thresholding method were employed so that the result of the preprocessing was improved. In the section of image segmentation, the classical split-merge algorithm was applied, and the result improved by a grouping algorithm. In the section of face matching, an algorithm using a geometric model based on eyes and mouth was presented. Discussion was conducted on the construction of evaluation functions.
Under Microsoft Windows 98 and Borland Delphi 3.0, a face locating software was developed using the algorithms mentioned above. Experiments showed that the software is capable of detect and locate front-view face(s) which is(are) big and clear enough. The typical time consumed is 3~30 seconds.
In the end, this paper probed into the advantages and disadvantages of the geometrical matching and the split-merge algorithms, and put forward suggestions to future work.
Key words: Face locating, geometrical matching, split-merge, thresholding, image segmentation, grouping, evaluation function.
基于几何匹配和分合算法的人脸识别
摘& nbsp; 要.......................................................... 1
Abstract........................................................ 2
目& nbsp; 录.......................................................... 3
第一章& nbsp; 引言.................................................... 4
1.1& nbsp; 人脸定位概述及其与人脸识别的关系...................... 4
1.2& nbsp; 人脸定位算法.......................................... 5
1.3& nbsp; 分割算法和区域生长.................................... 6
1.4& nbsp; 论文的主要工作........................................ 7
第二章& nbsp; 一种有效的分割算法: 分合算法............................ 8
2.1 人脸定位中的图像分割................................... 8
2.2 分合算法描述........................................... 9
2.3 成组算法.............................................. 13
2.4 形状属性的计算........................................ 14
第三章& nbsp; 预处理和几何匹配....................................... 19
3.1& nbsp; 预处理............................................... 19
3.2& nbsp; 几何匹配算法......................................... 24
第四章& nbsp; 软件的组成和操作....................................... 28
4.1& nbsp; 软件的组成........................................... 28
4.2& nbsp; 软件的操作........................................... 30
第五章& nbsp; 论文工作总结........................................... 32
6.1& nbsp; 关于几何匹配算法和分合算法的总结..................... 32
6.2& nbsp; 将来工作的展望....................................... 34
6.3& nbsp; 致谢................................................. 34
参考文献....................................................... 35
第一章& nbsp; 引言
1.1& nbsp; 人脸定位概述及其与人脸识别的关系
这个毕设所涉及到的是人脸的定位和识别。简单来说,所谓人脸的定位,就是在照片(静态图像)或视频(动态图像)中标出人脸所在的位置,把人脸选取出来。而人脸的识别就是把选取出来的人脸与数据库中已有的人脸进行比较,找出匹配的档案来。有的文献把人脸的定位和识别统称为人脸识别,定位和识别则是两个主要的步骤。完整的人脸识别系统涉及到决定照片或视频中有无人脸,并计数,定位,定出大小,然后根据数据库识别出个人,可能的话还要识别表情,以及根据脸的图像做出描述(瓜子脸,丹凤眼等等就是日常生活中“描述”的例子),或者反过来根据描述挑选匹配的人脸图像。
在日常生活中,我们主要根据脸来识别一个人。交谈中,我们往往看着对方的脸,尤其是眼睛。脸上的表情也是进行交谈的一个重要部分。所以,人脸在人与人的交流过程中起着极其重要的作用。这就决定了在现代社会中,使用计算机自动进行人脸的定位和识别工作有着重要的意义。其应用领域包括很多方面,比如身份鉴别,保安系统,人机交互界面等等。
人脸识别系统虽然有诱人的应用前景,但是在现实中却还没有开始大规模的使用。其主要原因之一就是用计算机自动进行人脸的定位和识别十分困难,目前的识别效果(正确率,速度)不如其他的生物识别技术,如指纹识别,视网膜识别等等。人们在日常生活中就进行了大量的人脸定位和识别工作,当然全部是由人的视觉系统和大脑“自动”进行的。目前还不清楚人的视觉系统和大脑的工作原理,因此这项人可以轻而易举完成的任务,对于目前还只会死板地执行程序指令的计算机来说却是极端困难。困难主要存在于两个方面:
1.人脸的图像数据具有高度的随机性。光照条件,脸的偏向,表情,发型,胡子,化妆,衣饰(眼镜,帽子)等等略有变化,就可以给识别系统带来巨大的困难。
2.人脸的图像数据量巨大。目前出于计算量的考虑,人脸定位和识别算法研究大多使用尺寸很小的灰度图像。一张64& acute;64像素的256级灰度图像就有4096个数据,每个数据有256种可能的取值。定位和识别算法一般都很复杂,在人脸库较大的情况下,计算量十分大,很多情况下速度令人难以忍受。而灰度数据事实上是丧失了象色彩,运动等等的有用信息的。如果要使用全部的有用信息,计算量就更大了。
因此,研究人脸的定位和识别不仅仅有实用上的考虑,而且对人们理解人脑的工作方式、研究人工智能和数字图像处理有重要的意义。
1.2& nbsp; 人脸定位算法
从模型匹配的方法来看,目前的人脸定位算法可以粗略地分为两大类:第一类是利用人脸各器官之间的几何关系的方法;第二类是利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法。第一类方法利用了明显的先验知识,因而方法简单明了,执行速度较快,对人脸的方向和表情有一定的适应性(在一定的变化范围内面部特征的相对几何关系变化很小), 但是准确率往往不高(漏判和误判),而且对预处理要求高,依赖于所有面部特征都完整地被提取,所以对转角较大的侧脸, 光照极度不均匀, 部分脸被遮蔽(眼镜, 围巾等)适应性不好。第二类方法利用了更多的图像信息,& nbsp; 准确率高,不易受欺骗;缺点是计算量大,而且使用的人脸模板受人脸库中已有资料的影响,可能会有通用性不好的问题(比如不同人种的人脸模板不能通用)。
利用人脸各器官之间的几何关系的方法的典型例子可以参见Shi-Hong Jeng, Hong Yuan Mark Liao等人(1)的文章。而利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法的典型例子可以参见Toshiaki Kondo和Hong Yan(2)的工作。
我认为利用人脸各器官之间的几何关系的方法可以作为完整的人脸定位算法的一个基础,就是说利用几何匹配先大致找到图像中的人脸(可能含有很多错误),然后使用利用标准人脸图像或者其变换结果直接或者经特征提取后进行匹配的方法来确证,剔除实际不是人脸的区域。这样既可以利用第一类方法的速度优势,又可以利用第二类方法的准确度优势。
1.3& nbsp; 分割算法和区域生长
从一幅图中,按一定规则划分出感兴趣的部分或区域叫做分割。对于利用人脸各器官之间的几何关系的人脸定位方法来说,分割算法是十分重要而关键的。在这里,感兴趣的部分是人脸的器官(眼睛,嘴巴,眉毛,鼻子等等)。分割算法如果能够有效地把人脸器官和脸的其他部分分离开来,并且保持器官的完整性(比如嘴巴没有破碎成几段),就是成功地达到了目的。
分割算法是数字图像处理中非常经典的课题,有着众多的算法可供选择。这些算法各有所长,但是没有哪一种是普适的。最常见的几类方法是:按像素或处理过的像素的灰度值进行分割(其实就是取阈值做二值化);提取边缘,利用边缘进行分割;区域生长方法。
区域生长方法寻找互相连接在一起,并有相同特征的像素所形成的区域(我把这样的区域称作特征块或者“物体”),是实现图像分割的一种重要方法。区域是一个二维连通区,所以生成区域的办法大致有三类:局部法:这是根据像素的性质或像素的临近像素的性质决定像素分在什么区域;总体法:这是根据遍及整幅图中大量像素的性质决定把一群像素划分到一个区域中;分裂合并法(简称分合):这是利用状态空间技术分裂或合并区域,用图结构表示区域和边界,这时要利用局部和总体的合并与分裂准则。