当前位置:首页 >> 信息与通信 >>

人脸识别系统






生物认证技术是依靠人类自身所固有的生理或行为特征进行身份验证 的一种手段。而生物认证中的人脸特征又是人与人之间互相辨识的最重要和 最直观的生物特征。由于人脸识别的无侵害性和对用户最自然、最直观的方 式,使人脸识别成为最容易被接受的生物特征识别方式。但由于人脸在成像 过程中受到诸如光照、表情、姿态等各种因素的影响,使得人脸识别是当前 最富挑战性的研究课题之一。 本文对人体生物认证在现实生活中的重要作用、人脸检测和人脸识别技 术研究的意义、系统要完成的任务、系统的评价标准、人脸检测和人脸识别 技术的发展的主要特点、实现方法等进行了介绍,并指出了当前人脸检测与 人脸识别领域的研究重点与难点,着重介绍和推导了人脸检测和识别的相关 算法,比如:AdaBoost 算法、具有局部互联结构的 BP 神经网络反向传播算 法数学,以及在分析了传统的弹性图匹配的基础上提出了人脸识别的基于局 部特征分析(LFA)与最优化匹配的人脸识别算法,该算法首先利用神经网络 的方法估计出在识别人脸中起重要作用的一些特征点(如瞳孔、眼角、眉心、 眉角、嘴角等),之后利用 Gabor 小波的局部多尺度分析特性提取特征点的 多尺度特征。这样人脸的每一个特征点就被一系列的 Gabor 小波系数所表 示,最后对待识人脸与人脸库中人脸的相应特征点多尺度特征进行最优化匹 配找出需要的人脸。 最后,介绍了 CMOS 图像传感器、ARM9 微处理器,设计了一个基于 ARM9 的人脸识别系统。 关 键 字:生物认证、人脸识别、神经网络、ARM

1

I

广西大学毕业设计论文

人脸识别系统

Human face recognition system
Abstract
Biometric recognition realizes personal identification based on the inherent physical or behavioral characteristics of human being, among which facial features are the most important and intuitional ones. Face recognition has become the most acceptable biometric recognition method because of its no violation of privacy and intuition. Face recognition is challenging in the pattern recognition due to the influence of illumination|, expression and pose. In this paper, we present a comprehensive review of face detection and recognition, which includes the face detection, face recognition and the current development in the literature. We also give a presentation of the major points and challenges in the face detection and recognition research. On the base of our research, introduced and transmit algorithm bout face detection and face recognition, such as: AdaBoost algorithm, the proof for BP Neural network algorithm. And traditional elastic graph matching is analyzed and a face recognition algorithm based on local feature analysis and optimization matching is put forward. Firstly, some important face features (such as pupil, canthus, center of eyebrow, corners of eyebrow, corners of mouth) are located using neutral network. Secondly, the multiscale features of the feature points are extracted using the local mutiscale analysis feature of the Gabor wavelet. In this way, every face feature point is represented by a series of Gabor wavelet coefficients. Finally, in order to find the face wanted, the test face is compared with the multiscale features of the corresponding feature points in the face database using the optimization matching. Finally, this article introduces basic functions of CMOS and ARM, designed a simple human face recognition system on the base of ARM. Key
ARM

words: Biometric

recognition,

Face

recognition, Neural

network,

II

广西大学毕业设计论文

人脸识别系统

目录
第一章 绪论.................................................................................................1 1.1 人体生物认证技术.........................................................................1 1.2 人脸识别原理.................................................................................4 1.2.1. 人脸检测与人脸识别的研究内容........................................4 1.2.2. 人脸检测与人脸识别的评价标准........................................4 1.2.3. 人脸检测与人脸识别的技术挑战........................................5 1.2.4. 人脸检测与人脸识别的实用价值........................................6 1.3 论文的主要研究内容.....................................................................7 第二章 人脸检测方法..................................................................................8 2.1 基于知识的方法..............................................................................8 2.2 基于模板匹配的方法.....................................................................11 2.3 基于学习的方法.............................................................................12 第三章 人脸检测算法 ……………...........................................................19 3.1AdaBoost 算法:..................................................................................19 3.1.1Boost 算法的一个直观解释.......................................................24 3.1.2 算法 3.1 的分类误差估计.........................................................25 3.1.3 具有局部互联结构的 BP 神经网络反向传播算法数学推 导……………………………………………………………………………..….27 3.2 人脸检测算法.....................................................................................27 3.2.1 图像预处理.................................................................................28 3.2.2 从局部到整体的人脸检测.........................................................29 3.3 实验结果……………………………………………………………..29 第四章 人脸识别方法.................................................................................33 4.1 基于 KL 变换的特征脸识别方法...............................................................33 4.2.基于几何特征的方法.....................................................................35 4.3 相关性匹配方法.............................................................................36 第五章 基于局部特征分析与最优化匹配的人脸识别算法.....................40 5.1 图像预处理.....................................................................................40 5.1.1 人脸图像特征点定位................................................................40 5.1.2 利用 Gabor 小波提取人脸局部的多尺度特征........................40
III

广西大学毕业设计论文

人脸识别系统

5.1.3 局部特征的最优化匹配...........................................................42 5.2 人脸匹配识别................................................................................45 5.3 实验结果…………………………………… ….………….….…46 第六章 基于 ARM 的人脸识别系统设计……….…………………....…46 6.1 CMOS 图像传感器简介…………………………..……….........46 6.2 ARM 介绍……………………………...…………….……..…....47 6.3 人脸识别系统的硬件设计……………………………………...51 6.4 人脸识别系统的软件设计…………………………….……......57 第七章 总结与展望....................................................................................58 参考文献……………………………………………………………….….59 致谢……………………………………………………………………......61 附录一:人脸检测主程序………………………………………………..63 附录二:人脸识别主程序………………………………………………..65

IV

第一章 绪论
1.1 人体生物认证技术
在人们的日常生活中, 经常会遇到这样一些情况: 丢失钥匙而进不了门; 忘记密码而无法在 ATM 机上取钱;电脑中的重要资料被非法复制;手机被他 人盗用;银行存款被人冒提取。这些都会对生活带来不便,甚至会造成巨大 损失。先进的身份认证技术就可以避免这些现象的发生。 目前,身份认证所采用的方法主要基于身份标示物品(如钥匙、证件、 卡等)和身份标示知识(如用户名和密码等)来确定其身份。但两者都存在着 一些缺陷:标示物品容易丢失或被伪造,标示知识容易遗忘或被记错。更为 严重的是这些传统的身份识别方法往往无法区分标识物品的真正拥有者和 取得标示物品的冒充者,一旦他人获得了这些标示物品,就可以拥有相同的 权利。因此,我们急需一种更加方便、有效、安全的身份认证技术来保障我 们的生活,这种技术就是生物认证技术—我们自己的人体就是最安全、最有 效的密码和钥匙。 生物认证(Biometric)所依据的不是传统的标识物品或标示知识,而是 依靠人类自身所固有的生理或行为特征进行身份验证的一种解决方案。生理 特征与生俱来多为先天性的,如指纹、掌纹、掌形、虹膜、视网膜、静脉、 手形、人脸、DNA、骨架、耳型等人体的生理特征,以及说话者的声音、签 名的动作、行走的步态、击打键盘的力度等个人的行为特征。生物认证的技 术核心在于如何获取这些生物特征,并将其转换为数字信息,存储于计算机 中,利用可靠的匹配算法来完成验证与识别个人身份的过程[1]。 与传统的身份认证手段相比,基于生物认证的身份验证技术具有以下特 点:不易遗忘或丢失;防伪性能好,不易伪造或被盗; “随身携带",随时随 地可用。但并不是所有的生物特征都能够用来进行生物认证,能够用于生物 认证的生物特征应该具有以下的特点: 广泛性: 每个人都应该具有这种特征; 唯一性:每个人拥有的特征应该各不相同;稳定性:所选择的特征应该不随 时间发生变化;可采集性:所选择的特征应该便于测量;同时实际的应用还 给基于生物特征的身份鉴别系统提出了更多的要求,如: 1)性能的要求:所选择的生物统计特征能够达到多高的识别率,对于 资源的要求如何,识别的效率如何;
1 1

广西大学毕业设计论文

人脸识别系统

2)可接受性:使用者在多大程度上愿意接受基于所选择的生物统计特 征的系统; 3)安全性能:系统是否能够防止被攻击; 4)是否具有相关的、可信的研究背景作为技术支持; 5)提取的特征容量、特征模板是否占有较小的存储空间; 6)价格:是否达到用户所接受的价格; 7)速度:是否具有较高的注册和识别速度; 8)是否具有非侵犯性。 人体生物的生物特征包括生理特征和行为特征两大类。人体的生理特征 主要包括人脸、指纹、掌纹、掌形、虹膜、视网膜、静脉、DNA、颅骨等, 这些特征是与生俱来的,是先天形成的;而行为特征包括声纹、签名、步态、 耳形、按键节奏、身体气味等,这些特征是由后天的生活环境和生活习惯决 定的。这些生物特征本身固有的特点决定了其在生物认证中所起的作用是不 同的。表 1 对各种生物认证技术作了一个简单的比较。 表 1 各种生物认证技术的比较[2]
生物特征 指纹 掌纹 掌形 虹膜 视网膜 静脉 DNA 声纹 签名 步态 人脸 气味 耳形 普遍性 中 高 中 极高 极高 高 极高 高 中 中 高 高 中 唯一性 高 高 中 极高 极高 高 极高 低 低 低 低 高 中 稳定性 高 高 中 极高 极高 高 极高 低 低 低 中 高 高 可采集性 中 高 高 高 低 高 低 高 高 高 高 低 中 准确性 高 极高 中 极高 极高 高 极高 低 低 低 低 低 中 可接受性 中 高 中 高 低 高 低 高 高 高 高 中 高 安全性 中 高 中 高 高 高 低 低 低 中 低 低 中 设备成本 中 高 中 高 高 高 高 低 低 低 低 高 低

“9.11”事件是生物特征认证技术在全球发展的一个转折点。 “9.11”以 后,生物识别技术的重要性被全球各国政府更加清楚地认识到。传统的身份 鉴别技术在面临反恐任务时所表现出来的缺陷,使得各国政府在研究与应用
2

广西大学毕业设计论文

人脸识别系统

上对生物特征识别技术开始了大规模的投资。在美国:三个相关的法案(爱 国者法案、边境签证法案、航空安全法案)都要求必须采用生物识别技术作 为法律实施保证。总体上来说,在国外生物认证技术的应用已经进入了以政 府应用为主的阶段。 普通公众对生物识别技术的了解也是“9.11”的曝光后而大幅度提高, 种种因素,促成了“9.11”以后全球生物特征认证市场的加速增长。在国际 生物认证组织最新的市场预测报告中,即使考虑到全球的经济发展的不景 气,调低了 2005 年的市场预测值,即使这样到 2005 年为止,全球生物特征 技术市场规模将仍将达到 22 亿美元规模,到 2007 年整体市场容量被调高到 了 40 亿美元。这充分说明了业界对生物特征识别技术发展的信心。

图 1-1 由国际生物认证组织(IBG)提供 1999 年—2005 年生物识别 技术产值增长趋势 2003 年,联合国的国际民用航空组织(ICAO)近期对 188 个成员国发 布了航空领域使用生物特征认证技术的规划,提出将在个人护照中加入生物 特征(包括指纹识别、虹膜识别、人脸识别) ,并在进入各个国家的边境时 进行个人身份的确认。目前,此规划已经在美国、欧盟、澳大利亚、日本、 韩国、南非等国家和地区通过,计划在 2004 年底左右开始实施。遗憾的是 其中不包括中国。在我国,生物认证技术除了能够繁荣一个新兴的产业,更 重要的是其提供的身份鉴别能力对国家安全的重要意义:首先,中国作为最 耀眼的社会主义国家,国家安全问题仍然需要警惕;其次,中国人口多、流 动性大,需要有更为先进的身份鉴别技术来保证社会秩序;再次,生物认证 技术将有效解决国内的假冒伪劣证件、证书问题;最后也是最实际的、需要
3

广西大学毕业设计论文

人脸识别系统

迫切面对的问题,那就是 2008 年奥运会和 2010 年世博会,如果能将生物认 证技术用于大型集会的身份鉴别无疑能够更加确保大会的安全。幸庆的是由 清华大学电子工程系苏光大教授主持人脸综合识别系统研制成功,经过近一 年的试运行,已通过了由公安部主持专家鉴定,并将用于 2008 年北京奥运 会的。

1.2 人脸识别原理[2]
人脸识别可以说是人们日常中最常用的身份确认手段,也是当前一个活 跃的研究领域,极富有挑战性。人脸识别就是通过与计算机相连的摄像头动 态捕捉人的面部,同时把捕捉到的人脸与预先录入的人员库存中的人脸进行 相比较识别,原理如图 1-2 所示。由图可以看出,人脸检测是人脸识别的前 提,而人脸检测和人脸识别是人脸识别系统的关键。

输入图像

人脸检测

特征提取

人脸识别

输出结果

图 1-2 人脸识别系统原理框图

1.2.1 人脸检测与人脸识别的研究内容
(1)人脸检测(Face Detection) 人脸检测(Face Detection)是指在输入图像中确定所有人脸(如果存 在)的位置、大小、位姿的过程。Yang 等将人脸检测定义为:任意给定一幅 图像或者一组图像序列,人脸检测的目的就在于判定该图像或者图像序列中 是否存在人脸。如果存在,则返回其位置和空间分布[1]。 (2)人脸识别 人脸识别细分为两类,一类是回答我是谁的问题,即辨认 (Identification) , 另一类是回答这个人是我吗?即确认 (Verification) 。 显然,用于 Identification 模式的识别系统对算法的运算速度的要求要高 于 Verification 模式的识别系统[1]。从人脸自动识别技术所依据的理论来 讲,人脸检测与人脸识别都是模式识别问题。人脸检测是把所有的人脸作为 一个模式,而非人脸作为另一个模式,人脸检测的过程就是将人脸模式与非 人脸模式区别开来。人脸识别是把每一个人的人脸作为一个模式来对待,不
4

广西大学毕业设计论文

人脸识别系统

同人的脸属于不同的模式类,人脸识别的过程是将属于不同人的脸归于各自 的模式。换句话说,人脸检测强调的是人脸之间的共性,而人脸识别则要区 分不同人脸之间的差异,二者同属于模式分类问题。

1.2.2 人脸识别系统的评价标准
人脸识别系统的最后重要一步,即进行性能评价。和其他识别系统一样 人脸识别系统的性能时很难进行评价的,在评价时必须注意以下几点: (1) 必须有足够用于评价的大量测试样本; (2)样本图像应与实际应用中出现的 图像尽可能相似而且要有代表性; (3)除了讨论系统的错误接受率外,还应 该考虑系统的错误拒绝率。评价一个人脸识别系统主要有如下标准: (1)系统识别率:即要求系统的识别率高,主要用错误的接受率和错误 拒绝率这两个性能指标评价,识别率与其之间的关系为:识别率=100%- 错 误接受率-错误拒绝率。 (2)对样本的约束:在不影响识别性能的情况下,要求训练样本数尽可 能少, 测试样本应比实际应用的更复杂, 同时要考虑系统的鲁棒广义化问题。 (3)速度和硬件要求:希望训练速度和识别响应速度尽可能快,而且对 硬件设备要求不是很高。 (4)人机界面:希望人机界面友好,并且不影响系统在实际中的应用。

1.2.3 人脸检测与人脸识别的技术挑战
进入 90 年代,随着各种相关研究的深入,人脸检测开始作为一个独立 的课题受到研究者的重视。同时人脸检测的应用背景也已经远远超出了人脸 识别系统的范畴,在基于内容的检索、数字视频处理、媒体资产管理、视觉 监测等方面有着重要的应用价值。人脸检测研究本身也具有重要的学术价 值。人脸是一类具有相当复杂的细节变化的三维非刚体自然结构目标,此类 目标的检测问题极具挑战性,主要表现在: (1)人脸由于外貌、表情、肤色等不同,具有模式的可变性; (2)一般意义下的人脸上,可能存在眼镜、胡须等附属物; (3)作为三维物体的人脸的影像不可避免地受到光照条件(光源的分布、 强度、方向等)的影响; (4)人脸和摄像机的相对角度; (5)人脸有时会不可避免地会被部分遮挡等等;
5

广西大学毕业设计论文

人脸识别系统

(6)人脸所处背景的复杂程度直接影响人脸的检测。 因此,如果能够找到解决这些问题的方法,成功构造出人脸检测与跟踪 系统,将为解决其它类似的复杂模式检测问题提供重要的启示。 人类的人脸识别能力很强,能够记住并辨别上千个不同人脸,可是计算 机则困难多了。其表现在:人脸表情丰富;人脸随年龄增长而变化;人脸所 成图像受光照、成像角度及成像距离等影响;而且从二维图像重建三维人脸 是病态(ill-posed)过程,目前尚没有很好的描述人脸的三维模型。

1.2.4 人脸识别系统的实用价值
人脸自动识别系统作为一种重要的个人身份鉴别方法,最早用于罪犯照 片管理和刑侦破案,现在这种技术在安全系统和商贸系统中都有很多的应 用,与其他身份鉴别方法相比,人脸识别具有直接、友好、方便和鲁棒性强 等特点。其应用领域主要有以下几类: 刑侦破案:在获得罪犯照片后,可以通过人脸识别技术,在存储的罪犯 照片数据库中找出最为相象的几个人列为嫌疑犯。罪犯数据通常非常大,如 果由人工完成搜索,不仅效率低,而且容易出错,因为人在看过上百幅人脸 图像后,记忆力就会急剧下降。所以这项工作必须使用计算机完成。人脸识 别用于刑侦破案始于七十年代初期,通常采用基于局部几何特征方法。 入口控制:入口控制的范围比较广,它可能是设在楼宇、单位或私人住 宅入口处的安全检查,也可能是计算机系统或情报系统等的入口控制。在楼 宇或者某些安全部门的入口处,比较常用的手段是核查证件,当人员频繁出 入时,请保安人员再三检查证件非常麻烦,而且安全系数也不高。人脸识别 技术还能用于设计新颖的私人住宅门锁,人脸是最为安全可靠的“钥匙” 。 2001 年美国“9·11”事件的发生,使得人脸识别技术的应用得到了极大的 重视,现在,美国多个机场都增加了人脸识别安检系统,以防范恐怖分子再 次实施恐怖活动。 视频监视:在许多公司、银行、公共场所都设有 24 小时的视频监视, 另外侦察破案时也要用摄像机对罪犯进行跟踪。证件验证:身份证、驾驶执 照以及其他证件上都有照片,采用人脸识别技术,证件的验证工作就可交给 机器完成,从而实现自动化智能管理。 军队安全系统:目前,全军军事重地有相当一部分是靠传统的铁门加警
6

广西大学毕业设计论文

人脸识别系统

卫 24 小时站岗,存在着容易被找到规律、利用管理人员的疏忽以及钥匙、 密码可能被复制盗取的隐患,而且由于地形隐蔽分散,不利于管理和监控。 基于人脸识别的门禁系统通过初始化人脸库,可以限定开门人员数量,免除 了钥匙密码被盗的后顾之忧,而且可以全天候自动监控并记录,便于追查。 银行系统我国银行金融系统对安全控制有着极高的要求。由于近年来金融诈 骗、抢劫的发生率有所增加,对传统安全措施提出了新的挑战。人脸识别技 术不需要任何电子或机械的“钥匙” ,可以杜绝丢失钥匙、密码的现象,如 果配合 IC 卡、指纹识别等技术可以使安全系数成倍增长,具有很高的性能 价格比。目前银行系统正在开展保险柜出租、托管业务,使用人脸识别系统 不但可以提升银行的安全系数, 还能大大提高银行在客户中的可信度。 总之, 人脸识别可以用于入口控制、视频监视、证件验证和刑侦破案等领域一方面 明显的提高了工作效率;另一方面,也具有极高的安全性和可靠性。同时人 脸识别还可以应用于电信会议、机器人智能化等领域,前景非常广阔。

1.3 论文的主要研究内容
本论文首先说明人体生物认证在现实生活中的重要作用,传述了人脸识 别系统的原理及构成,着重论述了人脸检测和人脸识别技术研究的意义以及 人脸识别系统要完成的任务、 系统的评价标准、 实现方法等, 并应用先进 ARM9 微处理器设计了一套较为完整的人脸识别系统。着重在以下三个方面进行了 较为细致的探讨。 (1)介绍了对人脸进行的检测和识别的方法及相应算法,并对相关算法 数学推导和证明,利用 VC 软件编程实现相关算法, 进行人脸检测实验, 取得 较好的效果。 (2)在分析了传统的弹性图匹配的基础上,提出了一种基于局部特征分 析(LFA)与最优化匹配的人脸识别算法,并用 MATLAB 软件编程实现相关算 法,对 Yale 大学的人脸库和 ORL 人脸库进行实验。 (3)设计了基于 ARM9 微处理器的人脸识别系统。
++

7

广西大学毕业设计论文

人脸识别系统

第二章 人脸检测方法
人脸检测(Face Detection)是指在输入图像中确定所有人脸(如果存 在)的位置、大小、位姿的过程。人脸检测方法主要分为以下三类:1.基于 知识的方法;2.基于模板匹配的方法;3.基于学习的方法。这种分类并不十 分严格,某些分类之间可能存在明显的交叉。 1.基于知识的方法 基于知识的方法首先抽取几何形状、灰度、纹理等特征并形成一定的规 则,然后检验这些规则是否符合人脸的先验知识。这类方法一般检测速度都 很快,但精度较差,主要用来人脸的粗检测。 2.基于模板匹配的方法 这类基于模板匹配的方法利用人脸的部分或全部的标准特征模板和输 入图像中所有的区域执行匹配操作,利用模板和区域之间所得的匹配度量来 检测人脸。 这类方法的速度一般要慢于方法 1, 但精度一般稍好于方法 1 (这 取决于图像预处理的水平) 。这类方法一般使用快速傅利叶变换或快速数论 变换来加快匹配速度。 3.基于学习的方法 这类基于学习的方法一般依靠统计分析和机器学习技术来学习人脸样 本和非人脸样本,从而达到区分人脸和非人脸的目的。这类方法如果学习样 本比较充分,分类器选择得当一般来说精度要好于上述二种方法。但这类方 法大多需要很大的计算开销,所以一般结合上述二种方法中的一种或二种来 使用。

2.1 基于知识的方法:
这种方法来源于研究人员对人脸信息的认识,研究人员很容易总结一 些规则描述人脸的特征和它们之间的相互关系。例如人脸的几何形状满足一 般性的约束,人脸面部器官的分布大致符合三庭五眼的规则。正视时,人脸 可近似为椭圆形或长方形,是一个左右对称的物体(正常人正常情况下) , 人的面部是由比较平坦的面部皮肤和按一定规则分布在其上的器官(眉毛、 眼睛、鼻子、嘴巴)来构成的,皮肤区域的颜色较亮,各器官的颜色较暗,
8

广西大学毕业设计论文

人脸识别系统

这些知识是人眼认知人脸的基本依据。对于人脸检测来说,人们利用这些知 识,发展了众多的基于知识规则的人脸检测算法。随着这种基于知识规则的 人脸检测算法的应用也带来了一个问题,就是定义一个对所有脸都适用的规 则是非常困难的(甚至是不可能的) 。如果规则定义的过于严格,环境稍有 变化(例如光照条件的变化、表情的变化等)就有许多正常的人脸不能通过 所有的规则而不能被检测。如果规则定义的过于宽泛,就会出现许多不是人 脸的区域被当作人脸区域而检测到。此外,很难把这种方法推广到检测不同 姿态人脸的问题中去。下面介绍典型的几种: 1.利用人脸图像空间分布规律的知识利用人脸模式的图像不变性,即人 脸共有的独特空间图像分布的相互关系,人脸上的亮度分布有一定的顺序结 构,图像中灰度分布最符合这种不变性的部分就是人脸部分。
第一层 输入图像 人脸候选区域 第二层 基本人脸位置 第三层 人位置和分割

图 2-1

马赛克法三层结构示意

2.利用人脸器官分布规律的知识 人脸器官分布比较规律,适用于证件照片上头部位置比较固定的情况, 最常见的是眼睛定位,常用的方法是对于边缘图像作垂直和水平方向的“积 分投影”并结合五官分布的先验知识。利用眼睛部位水平边缘线丰富的特点 定位出眼睛在垂直方向上的大致位置[4]。用垂直方向边缘图像的积分投影检 测脸的两侧和鼻子,水平方向边缘积分投影用于定位眼睛、嘴巴和鼻子。人 脸具有一定的轴对称性,器官也具有一定的对称性,比如人的左右眼睛是对 称的等[5]。

图 2-2 马赛克法第一层四分块 利用广义对称变换理论和边缘图像确定人脸对称轴,然后根据人脸五官
9

广西大学毕业设计论文

人脸识别系统
[6]

分布的约束条件及在对称轴上对称值最大的地方定位眼睛和嘴巴 。提出连 续对称性检测方法,检测一个圆形区域的对称性,利用人脸的五官特性,从 而确定是否为人脸[7]。

3.马赛克图像法(mosaic image method)
马赛克是一种简单的图像多分辨率表示方法,建立了一个基于知识的三 层检测系统[8]。
输入候选区域
NO

有眼吗?
YES NO

有鼻子吗?
YES

NO

有嘴吗?
NO YES YES

有鼻子和嘴的组合吗?

可能存在人脸

没有人脸存在

图 2-3 马赛克法第二层方框图 第一层针对 4×4 的马赛克图像块(quartet) ,根据相应的知识规则寻 找人脸候选区域;第二层针对 8×8 的马赛克图像块(octet) ,也是根据知 识规则从各候选区域中确定人脸区域;第三层在人脸区域内采用改进的边缘 检测算法进一步确定眼、嘴等器官的位置。图 2-1 为其总体方框图,图 2-2 为第一层 4×4 的马赛克图像块(quartet) ,图 2-3 为第二层的方框图,图 2-4 为第三层的方框图。
本地直方 图归一化

平滑

二值化

边缘 检测

跟踪

特征 提取

图 2-4 马赛克法第三层方框图

2.2 基于模板匹配的方法
10

广西大学毕业设计论文

人脸识别系统

模板匹配法就是计算出固定目标模板和候选图像区域之间的相关性或 差异性,作为匹配准则来搜索人脸,这种方法具有简单、直观的特点。当人 脸的模式过于复杂而不能用单一模板建模时,可以使用几个相关模板检测那 些相对稳定的人脸局部特征。 1.可变形模板法(Deformable templates method) 这是哈佛大学以 A. Yuille 为首的研究小组提出的一种器官精确定位方 法
[12]、[13]、[14]

。所谓可变形模板,是对眼睛、嘴巴等面部器官形状的一种参数

化描述,如 2-5 眼睛可以用一个圆外加两条抛物线段来表示。同时,与模板 的性质相对应, 定义一个与图像中边缘 (edges) 、 峰值 (peak) 、 谷值 (valleys) 等相关的能量函数。将模板动态地作用于图像,通过修改其参数使能量函数 值达到最小,也就是通过模板的变形在图像中找到其最佳匹配。由于可变形 模板法利用了全局性信息,因而提高了人脸检测的可靠性,但同时也暴露出 初始位置难于确定、权值选取依赖经验、可能陷入局部极小、计算量大等不 足。

眼模型 图 2-5 两种可变形模板 对于可变形模板法的改进可分为以下几类: 1、对于能量函数的修正;

嘴模型

2、对于可变形模板的补充。例如:头部轮廓、面额和下巴的可变形模 板; 3、 对于模板初始位置的估计算法。 例如: 角点检测 (corner detection) 、 数学形态滤波器(morphological filter)等; 4 、对于匹配方式的改进。例如:基于区域的策略( region-based strategy) 、自适应哈夫变换(AHT,Adaptive Hough Transform)等。 2.活跃轮廓模型法(active contour model method) 活跃轮廓模型法亦称蛇形法(snakes method) 。活跃轮廓是一条在外部 约束力作用下的能量最小化样条曲线。它通过迭代的方法可以不断修正,逐 步趋近图像中的线条或边缘。采用这个方法完成了头部轮廓、眉毛及鼻孔的
11

广西大学毕业设计论文

人脸识别系统
[16]

检测 。类似地,也用它进行头部轮廓检测

[15]



2.3 基于学习的方法
1.特征脸方法(eigenface method) 美国 MIT 的 M.Turk 和 A.Pentland 在人脸识别领域中提出了著名的 特征脸方法[17],同时也将它用于人脸检测。特征脸的基本思想是任意输入图 像都可以表示为“特征脸”的线性组合,线性组合的系数反应了该人脸的特 性。特征脸方法的实质是通过 K-L 变换获得人脸模式在整个图像空间中的 降维子空间(称为“脸空间” ) ,并根据待识别样本到脸空间的距离确定它是 否属于人脸模式。如果对人脸轮廓或面部器官进行同样的计算,便可将特征 脸方法用于人脸轮廓检测或面部器官检测。 一幅 N ? N 大小的人脸图像[ aij ]按列相连而构成一个 N 2 维矢量:

X ? (a11, a21..., aN1, a22 ,..., aN 2 ,..., a1N , a2 N , ...aNN )
它可被视为 N 2 维空间中的一个点,由于人脸结构的相似性,当把许多 这样的人脸图像归一化之后,这些图像在这一高维空间中不是随机散乱地分 布的,而是存在某种规律,这样,可以通过 K-L 变换用一个低维子空间描 述人脸图像。 由于 K-L 变换方法在本质上依赖于图像灰度在空间分布上的相关性,在 进行 K-L 变换之前,对待检测的人脸图像需要进行一系列的预处理,以达 到位置校准和灰度归一的目的。 以归一化后的标准图像作为训练样本集,以该样本集的总体散布矩阵, 计算总体散布矩阵的特征值和正交归一特征向量。对任一待识别样本 f ,通 过向“特征脸”子空间投影求出其系数向量,其重建图像的信噪比为:

? f 2 ? ? RSN ? 10lg ? ? 2 ? ? f ? f ? ? 若其小于预先设定的阈值,则可判断 f 不是人脸图像。只利用前若干张
特征脸将人脸向量投影到主元子空间 F 和与 F 正交的补空间 F
[18]

。距离

度量也分成两部分,一个称为 DIFS(Distance In Feature Space),另一个
12

广西大学毕业设计论文

人脸识别系统

称 DFFS(Distance From Feature Space)。在很多情况下,只计算 DIFS 就 能获得很好的分类效果。特征空间的分解示意如图 2-6 所示。

F
DIFS DFFS

F
图 2-6 特征空间的分解

2. 人工神经网络方法(neural networks method)
神经网络具有记忆功能,当训练样本比较全面时神经网络可以处理比较 复杂的检测问题,所以许多检测算法采用神经网络方法。人脸模式、眼睛模 式和嘴巴模式等都有比较明显的特点,因此可以采用神经网络的识别方法。 多层感知器(MLP)早就被用于人脸模式的分类,先用 Kohonen 网络对 原始训练集进行粗分类,然后用 MLP 网络进行精确分类,检测效果比较理 想[19]。用一个分级的特征检测系统定位眼睛和嘴巴,降低分辨率后的图像输 入四个已被训练过的多层感知器,能对左右眼睛、嘴巴和人脸中心进行粗定 位,然后再经过处理定位出比较精确的眼睛的上下左右四个眼角定点并分割 嘴巴区域。该方法对光照变换、人脸倾斜角度较大或遇到训练集里没有的较 大的眼睛时,定位效果会变差[20]。 使用分层网络,该网络由四个 BP 子网组成,分别检测人脸。预处理时 先对原图进行边缘增强。网络分为两层, “子层”网有三个,分别检测眼睛、 鼻子和嘴巴。 “父层”网判断“子层”能否构成一张人脸[21]。 神经网络方法能够适应较为复杂的人脸检测,准确性也比较高,所以使 用神经网络进行人脸检测的算法比较多。但是,由于人脸属于高维矢量,导 致网络中训练节点众多,算法往往需要大量的训练样本,因此,神经网络方 法的研究着重于系统的优化训练。
13

广西大学毕业设计论文

人脸识别系统

利用神经网络进行学习时,则既需要正例,也需要反例。选择适当的训 练样本(尤其是反例的选择) 、适当的网络结构以及适当的学习算法,将使得 神经网络在用于人脸检测时具有很强的学习能力和推广能力。一种基于概率 决策的神经网络 (PDBNN,Probabilistic Decision-Based Neural Network) 分别进行人脸和眼睛的检测[22]。 这里着重介绍神经网络方法中两项有代表性的工作。采用椭圆 k-均值 算法(elliptical k-means clustering algorithm)。对 4150 个人脸样本 和 6189 个非人脸样本进行聚类分析,各自形成 6 个聚类,以此作为一种 基于分布的人脸模型 (distribution-based face model)。同时,以样本到 各个聚类的距离作为其特征矢量,对前向多层神经网络进行训练,利用这个 神经网络分类器实现人脸检测。使用 BP 网络进行人脸检测,网络具有的隐 节点,分别对应于输入图像的局部特征。该算法在训练过程中自动生成“非 人脸样本” ,其方法是输入不含人脸的场景图像,将被误判为人脸的子图像 作为“非人脸”样本[25]。为了提高正确率,系统还同时对几个网络分别处理 出来的结果进行综合调整。同时,将大量的人脸样本和非人脸样本直接送入 若干个具有不同感受野(receptive fields)的前向多层神经网络进行训练和 识别, 然后通过对发生重叠的检测区域进行仲裁, 得到最后的检测结果。 如 图 2-7 所示,其中左边半部分为脱机进行,右半部分为联机进行,系统分为 以下四个步骤: 1) 定位和姿态估计 首先用人工神经网络的方法,对样本脱机训练。样本包括正例(人脸) 和反例(非人脸) 。训练正例时,为了将面部特征(如眼、口、鼻等)位置 的不同而引起的差异降低到最小,需要进行对齐处理。在联机检测时,因为 无法获得这些面部特征的准确位置,所以不能用来定位候选人脸,而是采用 穷举的方法搜索所有的位置和比例, 寻找所有候选区域。 为了提高搜索效率, 采用了一种改进的搜索算法,代价是检测率有所降低。对于非端正人脸的处 理也在这一步完成。用一个人工神经网络判断输入图像中人脸的倾斜角度。 然后根据倾斜角度将可能的人脸旋转变换为正面端正的人脸,再用同样的方 法检测人脸。 2) 预处理 为了进一步减少由于光照或成像条件不同带来的差异,图像需要经过标
14

广西大学毕业设计论文

人脸识别系统

准化预处理(如直方图均衡化)以调整总体的亮度和对比度。另外,还使用 了基于面部结构知识的光照补偿算法进行光照修正。 3) 检测 前两步对所有可能的人脸区域的位置、姿态和光照进行了标准化处理, 接下来要决定他们是否是人脸。这由经过了大量人脸及非人脸样本训练的人 工神经网络来完成。对于正面、半侧面和全侧面人脸的不同情况,使用不同 的神经元网络。 4) 仲裁 检测结果还要经过仲裁。仲裁在多个使用不同结构、不同训练策略的神 经网络之间进行。通过一些简单的启发式规则将判断结果进行综合,可以有 效地提高正确率,减少误报率。
脱 机 进 行 联 机 进 行

非人脸样本

人脸样本

测试图像

抽取所有窗口

对齐
估算姿态

预处理

预处理

检测姿态 1

检测姿态 检测姿态 2 3

训练检 测器

训练姿态 估算器

仲裁

输出

图 2-7 Rowley 等人提出的人脸检测系统

3.基于支持向量机的方法 支持向量机 (Support Vector Machine 简称为 SVM)是 AT&T Bell 实 验室的 V.Vapnik 领导的小组提出来的一种模式识别算法[7]。其思想是用关
15

广西大学毕业设计论文

人脸识别系统

键点代替整个样本集合,从而解决大数据量样本的分类问题。 以两类样本的分类问题为例,如图 2-8 所示,图中虚线是分界面(超平 面) 。显然,我们希望两类之间的间隔越远越好,从这个角度讲,(a)的分类 器要比(b)好。定义类间隔为两类样本中最接近的那些点到分解面的距离之 和,这些点被称为支持向量(Support Vectors),如图 2-8(a),箭头所指的 两点即为支持向量。所以,只要确定出支持向量,就能够求出分界面,其它 的样本点可以忽略。由于支持向量的个数远远少于所有样本点的个数,从而 能够大大提高分类速度。正因为 SVM 有如此好的特性,最近有越来越多的 学者把他应用于人脸检测的研究中[17]。

(a)

(b)

图 2-8 支持向量机原理示意图

16

广西大学毕业设计论文

人脸识别系统

第三章

人脸检测的算法

本章详细地介绍了著名的 AdaBoost 算法,通过训练出了 AdaBoost 算 法在训练观测基础上,给出了一个逼近估计的一个证明。阐述了指数损失函 数和 AdaBoost 算法的内在联系,指出了 AdaBoost 算法正是通过前向分步加 法建模方法使指数损失极小化,也正是这种内在联系给出了 AdaBoost 算法 的一个很直观的解释。其次给出了具有局部互联结构的 BP 神经网络反向传 播算法数学推导。最后设计并实现了一个以 AdaBoost 算法、局部互联的多 层感知机为主的叠层分类器,应用这个分类器对人脸进行检测及面部器官的 定位。

3.1 AbaBoost 算法
Boost 近十年来为解决模式分类问题而提出的最有效的学习思想之一。 Boost 方法的主要动机是合并许多“弱”分类器的输出以产生有效的“投票 委员会”的过程。从这一角度看 Boost 与其它基于委员会的方法具有相似之 处。然而,我们将看到联系是极其表面的,Boost 在本质上是不同的。我们 从最流行的 Boost 算法开始,介绍由 Freund 和 Schapire 在 1997 年提出的名 为 AbaBoost 算法[8]。 考虑一个 2-类问题,输出变量编码为 y ? ?? 1,1? 。给定预测子变量的向 量 x ,分类器
h?x ? 产生在 ?? 1,1?中取值的预测。训练样本上的误差率是:

1 err ? N

?I ?y
i ?1

N

i

? h( xi ) ?

(3.1.1)

一个弱分类器的误差只比随机猜测略好一些 ,Boost 的目的就是连续 对反复修改的数据应用弱分类算法,由此产生一个弱分类器序列

hm ( x) m ? 1, 2,...M 。然后一个加权的多数表决来合并全部预测,以产生最终
预测:

?M ? H ( x) ? sign ? ? am hm ( x) ? ? m?1 ?
17

(3.1.2)

广西大学毕业设计论文

人脸识别系统

这里 a1 , a2 , a3 ...am 提升算法来计算,并对每个 hm ( x) 的贡献加权。它们的 作用是对序列中较精确的分类器给予较高的影响。图 3-1 AdaBoost 过程的 示意图。最终分类器:

?M ? H ( x) ? sign ? ? am hm ( x) ? ? m?1 ?
加权样本

hM ( x)

加权样本

h3 ( x )

加权样本

h2 ( x )

训练样本

h 1 ( x)

图 3-1 AdaBoost 过程示意图 在每个 Boost 步,数据修改就是对每一训练观测 ( xi , yi ) i ? 1, 2,...N 实施 加权 W (i)(i ? 1, 2,...N ) ,开始 m ? 1 时,所有权都初始化为 w(i ) ? 1
N

,以便第

一步能够简单地用通常的方式在数据上训练分类器。对每一相继的迭代

m ? 2, 3... M, 观测的权值被分别修改, 并且分类算法被再次应用于加权观测。
在第 m 步那些被 h( x) 分类器误分类的训练观测相对应的观测权值提高,而 被正确分类的训练观测相对应的观测权值降低。这样随着迭代的进行,那些 很难正确分类的训练观测受到了不断增长的影响,因此,每个后继分类器被 强制关注被前面的分类器误分类的训练观测。 算法 3.1 给出了 AdaBoost 算法的细节。被 hm ( x) 误分类的训练观测的 观测权值被放大一个因子 exp(am ) ,增加了对导出序列中下一个分类器
18

广西大学毕业设计论文

人脸识别系统

hm ( x) 的相对影响。

算法 3.1 AdaBoost 初始化

w1 (i) ? 1/ N

i ? 1, 2,...N

对 m ? 1到 M 使用权值 wm (i) ,用分类器 hm ( x) 拟合训练观测 计算 errm ? 计算 am ?

? ?w
i ?1

N

m

(i ) yi hm ( xi )

1 ? errm 1 ln( ) 2 1 ? errm
wm (i ) exp(?am yi hm ( xi ))
i ? 1, 2,...N

wm?1 (i ) ?

?w
i

N

m

(i ) exp(?am yi hm ( xi ))

?M ? 输出 H ( x) ? si gn ? ? am hm ( x) ? ? m?1 ?

3.1.1 Boost 算法的一个直观解释
Boost 算 法 的 成 功 其 实 并 不 很 神 秘 , 它 的 关 键 在

?M ? H ( x) ? si gn ? ? am hm ( x) ? 。Boost 是一种拟合基本“基”函数集上的加法展 ? m?1 ?
开式的方法。这里每个基函数都是分类器 h( x) ∈{-1,1}, m ? 1, 2,...M 。更一 般地,基函数展开式取如下形式:
f ( x) ? ? amb( x, ? m )
m ?1 M

(3.1.3)

其中 am (m ? 1, 2,...M ) 是展开式系数, b( x; ? ) ? IR 通常是多元变量 x 的简 单函数,由参数γ 的集合刻画。例如:在单隐层神经网络中,
19

广西大学毕业设计论文

人脸识别系统

b( x; ? ) ? ? (? 0 ? ? 1t x) ,其中 ? (?) 是一个 S 型函数,而γ 对输入变量的一个
线性组合参数化。通常,通过极小化对训练数据取平均的损失函数来拟合这 些模型,如平方误差,
??m ,? m ?1

minM ? L( yi , ? amb( xi , ? m ))
i ?1 m ?1

N

M

(3.1.4)

对许多损失函数 L( y, f ( x)) 或基函数 b( x, ? ) ,都需要计算密集的数值优 化技术。然而,当仅拟合单个基函数的子问题的快速求解可行时,通常能够 找到一个较简单的方案,

min ? L( yi , b( xi , ? ))
? ,?
i ?1

N

(3.1.5)

通过相继添加新的基函数到展开式,而不调整已添加的参数和系数,前 向分步加法建模逼近解式(3.1.4) 。前向分步加法建模在算法 3.2 中给出。 在第 m 次迭代,我们求解最优基函数 b( x, ? m ) 和相应的系数 ? m ,并添加到当 前展开式 fm?1 ( x) 中。这样可以产生 fm ( x) ,并重复这个过程。先前添加的相 并不改变。对于平方误差损失:

L( y, f ( x)) ? ( y ? f ( x))2
我们有:

L( yi , fm?i ( xi ) ? ab( xi , ? )) ? ( y ? f m?i ( xi ) ? ab( xi , ? ))2 ? (rim ? ab( xi , ? )) 2
其中, rim ? yi ? f m?1 ( x i ) 是当前模型在第 i 个观测上的误差(残差) 。这样 对于平方误差损失, 每一步把对当前残差拟合最好的项 ? mb( x; ? m ) 加到展 开式中。 算法 3.2 前向分步加法建模 初始化 f0 ( x) ? 0 对于 m ? 1, 2.....M
20

广西大学毕业设计论文

人脸识别系统
N

计算 ( ? m , ? m ) ? arg min ? L( yi , f m?1 ( xi ) ? ab( xi , ? ))
i ?1

置 f m ( x) ? f m?1 ? amb( x, ? m ) 现在我们证明 AdaBoost 算法(见算法 3.1)等价于使用如下损失函数 的前向分步加法建模(见算法 3.2) :
L( y, H ( x)) ? exp(? yH ( x))

(3.1.6)

对于 AdaBoost,基函数是单个分类器 hm ( x) ???1,1? ,使用损失函数,必 须求解:
(am , h m ) ? arg min ? exp[? yi H m?1 ( xi ) ? ah( xi ))]
i ?1 N

(3.1.7)

得到每步要添加的分类器 hm 和相应得系数 am 这可以表示为:
(am , hm ) ? arg min ? wm (i) exp[?ayi h( xi )]
a ,h i ?1 N

(3.1.8)

其中 wm (i) ? exp(? yi Hm?1 ( xi )) 为了以后讨论问题的方便单位化 wm (i) 得:
wm (i ) ? wm (i )

?w
i ?1

N

m

(i )

因为每个 wm (i) 即不依赖 ? 也不依赖 h( x) 它可以看作是应用于每个 观测的权值。该权值依赖于 H m?1 ( xi ) ,所以,个体权值随每次迭代 m 而改 变。 式(3.1.8)的解可以通过两步获得。 第一步, 对任意的 ? ? 0 , 关于 hm ( x) 式(3.1.8)的解是:

21

广西大学毕业设计论文

人脸识别系统

hm ? arg min ? wm (i) I ( yi ? h( xi ))
i ?1

N

(3.1.9)

满足 (3.1.9) 式得 hm 就是预测 y 时极小化加权误差率的分类器。将 (3.1.8)的标准用下式表示,这一点容易明白:
N ? ? (am ,hm ) ? arg m in e ? a ? wm i ? e ( a ) ? wm i ? ( ) ? ? a ,h i ?1 ? y ?h ( x ) y ? h xi ( ) ?

(3.1.10)

另外由我们定义的加权误差率

errm ? ? ?wm (i )yi hm x (i ? )
i ?1

N

y ?h ( xi )

?

?wm i (?) ? wm i ( )
y ? h xi ( )

(3.1.11)

联合(3.1.10) ,(3.1.11)及 wm (i) 是单位化的向量得:
1 1 ? errm am ? ln( ) 2 1 ? errm

(3.1.12)

然后逼近被更新为

Hm ( x) ? Hm?1 ( x) ? amhm ( x)
它导致下一次迭代的权值是:
wm?1 (i ) ? wm (i ) exp(?am yi hm ( xi ))

(3.1.13)

?w
i

N

(3.1.14)

m

(i ) exp(?am yi hm ( xi ))

因此我们得出结论: AdaBoost 算法通过前向分步加法建模方法使指数损 失(3.1.6)极小化。

3.1.2 算法 3.1 的分类误差估计

22

广西大学毕业设计论文

人脸识别系统

? w (i) exp(?a
m i

N

m i m

y h ( xi ))
yi ? hm ( xi )

?

yi ? hm ( xi )

?

wm (i) exp(?am ) ?

?

wm (i) exp(am )
(3.1.15)
1 2

? 1 ? errm ? ? 1 ? errm ? ?? ? exp(?am ) ? ? ? exp(am ) ? 2 ? ? 2 ?
2 ? 1 ? errm ? ? 1 ? errm ? ? 1 ? errm ? ? 1 ? errm ? ?? ? ?? ? ?? ?? ? 2 ? ? 1 ? errm ? ? 2 ? ? 1 ? errm ? 1

? ?1 ? errm 2 ?

1

2

由(3.1.14)式可得:

? M ? exp ? ?? am yi hm ( xi ) ? ? wM ?1 (i) ? M N ? m?1 ? ? N ? ? ? wm (i) exp(?am yi hm ( xi )) ? ? t ?1 ? i
ERR ? 1 N

(3.1.16)

? [ H ( xi) ? y ] ? N ? exp(?a
i ?1 i i ?1

N

1

N

m

yi hm ( xi ))

N ? M ? N ?? ? ? ? ? ? ? wm ( j ) exp(?am y j hm ( x j )) ? ? wM ?1 (i ) ? ? i ?1 ? m ?1 ? j ??

? N ? M ? ? ? ? wm ( j ) exp(?am y j hm ( x j )) ? ? ? (1 ? err 2 m ) m ?1 ? j ? m ?1
M

1

2

? exp(?

1 M ? err 2m ) 2 m ?1



1 M ERR ? exp(? ? err 2 ) 2 m?1

(3.1.17)

3.1.3 具有局部互联结构的 BP 神经网络反向传播算法
数学推导 符号及变量约定: 神经网络的层数: L ; 神经网络各层的节点数: ni , i ? 1, 2...; ;
23

广西大学毕业设计论文

人脸识别系统

目标矢量记为: t ? [t1 , t2 , t3......] ; 则有第 i 层到第 i ? 1 层的变换为:
uki?1 ?
ki?aki ?1

?

wki?1 xK i

(3.1.18) (3.1.19)

xki?1 ? f (uki?1 )

其中 aki?1 为第 i ? 1 层第 ki ?1 个节点和第 i 层节点互连的集合,xki 为第 i 层 第 k i 个节点的输出 则第 p1 个样本输入时,其误差为各输出单元误差之和,满足:

E p1 ?
则总误差为;

1 n1 p1 P1 ? ?tkl ? xkl ? 2 Kl ?0

2

(3.1.20)

E总 ? ? E pl (w)
pl

(3.1.21)

具体学习算法的解析式推导如下: 令 n0 为迭代次数,可得到每一层的权的迭代公式为

wkl?1 kl (n0 ? 1) ? wkl?1 Kl (n0 ) ? n

?E总 ?wkl?1 kl

(3.1.22)

p1 ?E总 ?E P1 ?ukl ?E P1 p1 ?1 ? ? P1 ? ? p1 xkl ?wkl?1 kl p1 ?ukl ?1 ?wkl ?1kl p1 ?ukl ?1

(3.1.23)

当 i ? L ? 1 时:
p1 ?E P1 ?E P1 ?xKL p1 ? ? ?(tkpL1 ? xkl ) f ' (ukpL1 ) p1 1 ?ukPL ?xkpL1 ?ukl

(3.1.24)

当 i ? L ? 1 时:
p ?E P1 ?EP1 ?xK1l ?1 ?E P1 ' p1 ? p1 ? f (ukL ) 1 1 ?ukPL ?xkl ?1 ?ukpl1?1 ?xkpl ? ?1 1

24

广西大学毕业设计论文

人脸识别系统

? f ' (ukpl1?1 ) ?
' p1 kl ?1 nl ?2

p1 1 ?xK ?uip ?2 l ?2 p1 p1 kl ? 2?0 ?ukl ?2 ?xkl ?1 nl ?2 p1 ?xK l ?2

(3.1.25)

? f (u ) ?

kl ?2?0

?ukpl1?2

wkl ? 2kl ?

1

由(3.1.23)、(3.1.24)、(3.1.25) 即可组成一个反向传播算法,具体如下:

3.1.4 反向传播算法
由(3.1.23)、(3.1.24)计算倒数第一层既输出层的

?E总 : ?wkL k L ?1

计算倒数第二层的

?E总 ?E总 。计算倒数第二层的 分为两步 ?wkL k L ?wkL k L

通过(3.1.25)和上一层计算得到的

?EP1 ?u
p1 kl ? 2

计算得到

?E p1 。 ?ukpl1?2

后通过(3.1.23)计算本层的

?E总 。 ?wkl ?1kl

依次类推即可求出每层 的

?E总 。 ?wkl ?1kl

3.2 人脸检测算法
3.2.1 图像预处理
各种条件(环境光过强、过弱、侧光等等)都会对待检测人脸的图像产生 影响。为了减弱客观环境对图像的影响及后续处理上的方便我们分两步对图 像进行预处理。 第一步:对原图像做一次 a1 *a2 邻域的滤波处理,以消除一些噪音的影 响。

fG ( x, y ) ? 1 ? f 0 ( x, y ) a1 ?a2 ( a1 ? a2 ) ? 7 /16 ? f 0 ( x, y) 16
25

(3.2.1)

广西大学毕业设计论文

人脸识别系统

在这里 f0 ( x, y) 代表原始图像, f0 ( x, y)a1 ?a2 代表 f0 ( x, y) 的宽为 a1, 高为 a2 的矩形邻域的积分图像(在这里我们选择 a1 ? a2 ? 3 ),fG ( x, y) ) 代表原图像 f0 ( x, y) 经过(3.2.1)式滤波后得到的图像。 第二步:应用蒙片钝化法对图像进行再处理。

f M ( x, y) ? fG ( x, y) ? f0 ( x, y)b1?b2 ( b1 ? b2 )

(3.2.2)

根据被检测图像大小的不同 b1 , b2 的选择有所不同,在图像大小为 320*240 的情况下, 我们选择 b1 ? b2 ? 40 。 从式(3.2.1)可以看出, f M ( x, y) 图像与原图像

f0 ( x, y) 相比大体上消除了光照对图像局部的影响。 (a)

f0 ( x, y) (b) fG ( x, y) (c) f M ( x, y)
图 3-4 是一个有着很强侧光影响的原始图片经过第一、 第二步处理的效 果后续的人脸检测就是在 f M ( x, y ) 上进行的。

(a)

f0 ( x, y)

(b) fG ( x, y) 图 3-2 图像的预处理

(c) f M ( x, y )

3.2.2 从局部到整体的人脸检测
本小节主要分为四部分: 第一部分为眼睛的检测,这部分作者构造了一组眼睛 BP 网络分类器,
26

广西大学毕业设计论文

人脸识别系统

这组分类器在眼睛检测的训练集上通过 AdaBoost 算法的加权合并形成一 个有很强分类能力及很高冗余度的眼睛分类器。之后应用这个分类器在被检 测的图像上确定眼睛的候选区域。 第二部分为人嘴的检测,这部分作者构造了一组人嘴 BP 网络分类器, 这组分类器在人嘴检测的训练集上通过 AdaBoost 算法的加权合并形成一 个有很强分类能力的人嘴分类器。之后应用这个分类器在第一部分确定的眼 睛候选区域上判断与候选区域相关的位置是否有人嘴存在。 第三部分为人脸的检测,这部分作者构造了一组人脸 BP 网络分类器, 这组分类器在人脸检测的训练集上通过 AdaBoost 算法的加权合并形成一 个有很强分类能力的人脸分类器。之后应用这个分类器在第一部分与第二部 分确定的眼睛与嘴的候选区域上判断与候选区域相关的位置是否是人脸存 在。 1.眼睛分类器的结构

14*3(7节点) EYE_BP1

3*14(7节点) EYE_BP2

3*6(21节点) EYE_BP3
(c)

(a)

(b)

图 3-3 眼睛 BP 网络分类器感受野示意图 眼睛分类器由三个简单的 BP 神经网络组成如图 3-5 所示。 (a) 图 EYE_BP1 的输入层由 7 个节点组成,每个节点的感受野是图像中特定位置 的 14*3 矩形区域内灰度的均值。EYE_BP1 的作用主要是检测眼睛在水平方 向上所表现的特征。EYE_BP2 的输入层也由 7 个节点组成,与 EYE_BP1 不 同(b)图 EYE_BP2 中每个节点的感受野是图像中特定位置的 3*14 矩形区 域内灰度的均值。 EYE_BP2 主要是检测眼睛在竖直方向上所表现的特征。 (c) 图 EYE_BP3 的输入层由 21 个节点组成, 每个节点的感受野是图像中特定位 置的 3*6 矩形区域内灰度的均值。EYE_BP3 主要是检测眼睛在细节上的特
27

广西大学毕业设计论文

人脸识别系统

征。 我们在眼睛检测的训练集上通过 AdaBoost 算法训练这三个分类器时, 首先训练所有的正样本(眼睛的样本),以保证对对所有的正样本(眼睛)100% 正确地分类,之后在逐步添加负样本(非眼睛样本)进行训练,为了保证分类 器有足够的冗余,负样本添加的要适度。这样训练得到的分类器检测率在训 练集上是 100%,但误检率可能会比较高。这可以通过下两步的分类器迅速 降低误检率。 2.人嘴分类器的结构

16*3(7节点) EYE_BP1

3*16(7节点) EYE_BP2

3*8(21点) EYE_BP3

(a)

(b)

(c)

图 3-4 人嘴 BP 网络分类器感受野示意图 人嘴分类器所用的 BP 神经网络结构和眼睛分类器所用的 BP 神经网络分 类器的结构基本一样,只是感受野的大小不同,如图 3-6 所示。人嘴分类器 的训练过程和眼睛分类器的完全一样。只是人嘴的训练样本的采集要在眼睛 分类器确定的候选区域上进行,这样做的目的是极大地减少了非人嘴样本的 数量。加快分类器的训练速度,提高分类器的冗余。 3.人脸分类器的结构
感受野 网络输入 感受野 网络输入 网络输出
20 by 20 pixles 20 by 20 pixles

局部互联神经网络

局部互联神经网络

28

广西大学毕业设计论文

人脸识别系统

图 3-5 人脸 BP 网络分类器感受野示意图 人脸分类器的结构我们使用了多个完全一样的局部互联 BP 网络,网络 结构和 Rowley 使用的用于检测人脸的神经网络结构完全一样见图 3-7。训 练方法同眼睛和人嘴的分类器结构完全一样。但在这里我们并没有使用固定 数目的 BP 分类器,目的是可以用增加 BP 神经网络的数量来满足不同的人脸 检测精度要求。人脸的训练样本的采集同人嘴的训练样本的采集一样,也要 在眼睛和人嘴的候选区域上进行,目的同人嘴分类器训练样本的选择相同。 为了提高系统的执行速度我们采用了以下几种策略: (1)由于每个 BP 神经网络的输入节点的输入值都对应图像中一个矩形区 域的均值,而图像中每一点矩形邻域的均值可以通过积分图像的方法以极快 的速度求得。 (2)我们知道计算机浮点运算的速度要远低于定点运算的速度,所以我 们对 BP 神经网络的计算采用查表的方法将浮点运算转换为定点来计算,这 又进一步加快了运算速度。 (3)为了检测不同尺度的人脸,我们并没有对图像采用金字塔式的搜索 算法, 而是采用与之相等价的算法, 即将 BP 神经网络的感受野逐次以 1.15 倍地放大,之后再应用积分图像法求放大后矩形区域的均值。这样做不仅仅 是加快了运算速度,而且还减少了由于采用金字塔算法对图像进行放缩而带 来的失真,是一举两得之法。整个人脸检测的系统流程如图 3-6。

29

广西大学毕业设计论文
输入图像
NO

人脸识别系统

眼睛检测分类器
YES NO NO YES

人嘴检测分类器

不 存 在 人 脸

人脸检测分类器
YES

NO

存在人脸
图 3-6 人脸检测系统流程图

3.3.实验结果
这里利用 VC++软件编程实现图像预处理及 ABoost 算法, 并利用静态图像 实验人脸检测的图像如图 3-9 基于 ABoost 算法检测到的人脸 (a) 人脸区 域;(b)标记人眼;(c)标记人嘴(d)边缘提取,基本上满足要求,如果时间充 足的话,对程序和算法再进行修进应该会得到更好的结果。

(a)

(b)

(c)

(d)

图 3-7 基于 ABoost 算法检测到的人脸

30

广西大学毕业设计论文

人脸识别系统

第四章 人脸识别方法
与人脸检测相比,人们对人脸识别的研究要深入得多,本章讨论其中有 代表性的几种方法: 4.1 基于 KL 变换的特征脸识别方法 基本原理:KL 变换又称作 Hotelling 变换,是图象压缩中的一种最优 的正交变换。人们将它用于统计特征提取,从而形成了子空间法模式识别的 基础[7]。若将 KL 变换用于人脸识别,则需假设人脸处于低维线性空间,且 不同人脸具有可分性。由于高维图像空间 KL 变换后可得到一组新的正交 基,因此可通过保留部分正交基,以生成低维人脸空间。而低维空间的基则 是通过分析人脸训练样本集的统计特性来获得。KL 变换的生成矩阵可以是 训练样本集的总体散布矩阵,也可以是训练样本集的类间散布矩阵,即可采 用同一人的数张图像的平均来进行训练,这样可在一定程度上消除光线等的 干扰,且计算量也得到减少,而识别率不会下降。 也就是说,根据总体散布矩阵或类间散布矩阵可求出一组正交的特征向 量 u1 , u2 ,...un 其对应的全部特征值分别为 ?1 , ?2 ,...?n ,这样,在新的正 交空间中,人脸样本 X 就可以表示为:
X ? ? wi ui
i ?1 n

(4.1)

若通过选用 m(m ? n) 个特征向量作为正交基,则在该正交空间的子空 间中,就可得到以下近似表达式:
X ? ? wi ui
i ?1 m

(4.2)

如将子空间的正交基按照图像阵列排列,则可以看出这些正交基呈现人 脸的形状,因此这些正交基也被称作特征脸,这种人脸识别方法也叫特征脸 方法(如图 4-1) 。关于正交基的选择有不同的考虑,即与较大特征值对应 的正交基(也称主分量)可用来表达人脸的大体形状,而具体细节还需要用与 小特征值对应的特征向量(也称次分量)来加以描述,因此也可理解为低频成
31

广西大学毕业设计论文

人脸识别系统

分用主分量表示,而高频成分用次分量表示。其中,采用主分量作正交基的 方法称为主分量方法(PCA)。同时,也有人采用次分量作为正交基,原因是 所有人脸的大体形状和结构相似,真正用来区别不同人脸的信息是那些用次 分量表达的高频成分。

图 4-1 KL 变换用于人脸识别的一个形象说明 由训练得到特征脸后,将待识别人脸投影到新的 m 维人脸空间,即用 一系列特征脸的线性加权和来表示它,这样即得到一投影系数向量来代表待 识别人脸,这时候,人脸识别问题已转化为 m 低维空间的坐标系数矢量分 类问题,而分类最简单的做法是最小距离分类。 KL 变换在 90 年代初受到了很大的重视, 实际用于人脸识别也取得了很 好的效果,其识别率从 70~100%不等,这取决于人脸库图像的质量。从压 缩能量的角度来看,KL 变换是最优的,它不仅使得从 n 维空间降到 m 维空 间前后的均方误差最小,而且变换后的低维空间有很好的人脸表达能力,然 而这不是说已经具有很好的人脸辨别能力。选择训练样本的散布矩阵作为 KL 变换的生成矩阵,是由于其最大特征向量抓住了该样本集合的主要分布, 但这是图像统计, 而不是人脸统计方法。 它虽然考虑了图像之间所有的差异, 但由于它不管这样的差异是由照明、发型变更或背景导致,还是属于人脸的 内在差异,因此特征脸识别的方法用于人脸识别存在理论的缺陷[13]。 由于对 KL 变换而言,外在因素带来的图像差异和人脸本身带来的差异 是不加任何区分的,因此,不管如何选择正交基,也不能根本解决问题。其 改善的一个思路是针对干扰所在,对输入图像作规范化处理,其中包括将输 入图的均值方差归一化、人脸尺寸归一化等;另一种改进是考虑到局部人脸 图像受外在干扰相对较小,在进行人脸识别时,除计算特征脸之外,还可利 用 KL 变换计算出特征眼睛、特征嘴巴等。然后将局部特征向量加权进行匹 配,就能够得到一些好的效果。 4.2 基于几何特征的方法
32

广西大学毕业设计论文

人脸识别系统

几何特征方法采用的特征包括人脸五官如眼睛、鼻子和嘴巴等的局部形 状特征,脸型特征及五官在脸上分布的几何结构特征。提取特征时往往要用 到脸部图谱结构的一些先验知识,早期采用从侧面轮廓线提取特征的方法比 较多, 以后的工作则较多的采用人脸正面的特征, 因为证件照大多是正面照, 而且正面的特征信息比侧面的更丰富,特征的抗干扰能力也比较强。几何特 征法用几何特征矢量表示人脸,用层次聚类的思想设计分类器达到识别目 的。几何特征矢量是以人脸器官的形状和几何关系为基础的特征矢量,分量 通常包括人脸指定两点间的欧氏距离、曲率和角度等。 几何特征矢量必须具有一定的独特性,能够反映不同人脸之间的差别, 同时必须具有一定的弹性,消除时间跨度、光照等因素的影响。图像上边缘 点的积分投影曲线常被用于对眼睛、鼻子和嘴巴等进行定位。一维的“积分 投影” 曲线包含图像在某一方向的结构信息, 它是提取人脸特征的基本手段, 用于提取嘴角和眼角等特征需要原灰度图像光照均匀,层次分明,能提取到 准确的边缘。 “弹性模板”是一种更为准确的提取特征的方法,而所谓的“弹性模板” 就是模板在匹配特征形状时,其平移、形状和旋转都是可调的。对灰度图像 进行形态滤波,然后求出谷值区域、峰值区域和边缘区域图像,以此构造能 量函数,最小化能量函数的过程就是模板逐渐与特征形状匹配的过程[14]。他 们设计的眼睛模板是用圆代表眼球形状、抛物线描述内眼睑的形状、嘴巴模 板由几根抛物线组成。弹性模板适用于提取有确定形状的目标轮廓,对于眉 毛、下巴和鼻孔等不确定形状,提出了活动轮廓模板(snake)提取它们的 特征[15]。 用形态滤波求出原图的谷值图,从而突出眼睛和嘴巴等,用霍夫变换结 合约束条件检测眼球,弹性模板用于提取眼睛轮廓和嘴巴轮廓。同时,还利 用边缘图像和霍夫变换检测脸颊和下巴。对于脸颊和下巴的检测都依靠眼睛 和嘴巴的定位结果确定变换的搜索区域。基于几何特征识别最后归结为特征 矢量之间的距离。距离是测度两个特征矢量之间相似性的一种度量,基于欧 氏距离的判决是最常用的方法,大多数方法均简单采用欧氏距离作为相似性 度量。 4.3 相关性匹配方法 1.传统模板匹配法
33

广西大学毕业设计论文

人脸识别系统

在模板匹配中,人脸标准模板由人工来定义。对于输入图像,分别计算 标准板中的脸部轮廓、眼睛、鼻子等的相关值。模板匹配法通常采用“归一 化互相关” ,直接计算两幅灰度图像之间的相关程度,由相关程度来决定人 脸的存在,并要求两幅图像上的目标具有相同的尺度、取向和光照,所以必 须进行尺度归一、灰度归一的图像预处理。 Buhr 的方法使用眼睛模板定位眼睛, 然后用双眼之间的距离进行尺度归 一。匹配首先在低分辨率的图像中进行,对相关性大的图像进行五官的局部 模板相关匹配,当四分之三的局部模板具有很大的相似度,认为待识别图像 与库中图像属于同一人。首先提取特征点,然后根据特征点分出归一化后的 眼睛、嘴巴、鼻子和脸的模板,进行相关性匹配识别。 2.可变形模板匹配法 可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计 一个参数可调的器官模型,即可变形模板,定义一个能量函数,通过调整模 型参数使得能量函数最小化,此时的模型参数即为对象的几何特征。可变形 模板方法存在两个问题,一是能量函数中各种代价的加权系数只能由经验确 定,难以推广;二是能量函数在优化过程中十分耗时,难以实际应用。

图 4-2 人脸可变形匹配法 针 对 畸 变 不 变 性 的 物 体 识 别 提 出 了 动 态 链 模 型 ( Dynamic Link Architecture,DLA) ,将物体用稀疏图形来描述,(见图 4-2),其顶点用部 能量谱的多尺度描述来标记, 边则表示拓扑连接关系, 并用几何距离来标记。 对象的识别是利用基于匹配代价函数优化的可变形图匹配技术实现的。用可 变形模板去建模预先的可变形人脸特征[13]。这种方法中,人脸特征被描述成 参数模板。输入图像的边缘、波峰值、波谷值被对应于模板的参数,而构成 一个能量函数。通过调整参数,将函数能量最小的可变形模型作为人脸的最 佳匹配。将人脸图像 I ( x, y ) 建模为可变形的 3D 网格表面 ( x, y, I ( x, y)) ,
34

广西大学毕业设计论文

人脸识别系统

从而将人脸模板匹配问题转化为可变形曲面的可变形匹配模型。利用有限元 分析的方法进行曲面变形,并根据变形的情况判断两张图片是否为同一个 人。 3.基于小波特征的弹性匹配方法 采用属性拓扑图表示人脸,提出了弹性匹配的方法。拓扑图的任一顶点 均包含特征矢量,记录人脸在该顶点位置的分布信息,二维拓扑图的顶点矢 量采用人脸经小波变换后的特征矢量。用拓扑图分别代表已知和待识别的人 脸,根据匹配拓扑图算出他们的“距离” ,作为人脸的相似度准则。

图 4-3 定义在人脸上的二维拓扑图 在 KL 变换中,待识别人脸 X 和库中人脸 C 之间采用了通常的欧氏距 离来进行匹配。虽然欧氏距离计算简单,但是当 X 和 C 只有位移、膨胀(如 affine 变换)或是表情不同时,则欧氏距离不会等于零,甚至很大,此外, 若 C 作为人脸库中的已知人脸模板, 应该是描述人脸的关键特征, 它的维数 并不需要和待识别人脸一样,因而此时欧氏距离就不合适,而弹性图匹配法 是在二维的空间中定义了这样一个距离,它对通常的人脸变形具有一定的不 变性, 也不要求 C 、 X 维数一定相同。 可采用属性拓扑图来表达人脸(图 4-3 采用的是规则的二维网格图),其拓扑图的任一顶点均包含一特征矢量,它 记录了人脸在该顶点位置的分布信息(如图 4-3),二维拓扑图的顶点矢量就 是人脸经小波变换后的特征矢量。在图像的敏感位置 (如轮廓线、突出点 等),小波变换后生成的特征矢量的模较大。用拓扑图分别代表已知和待识 别人脸,还可根据匹配拓扑图算出它们的“距离” ,作为人脸的相似度准则。 人脸的相似度可用拓扑图的“距离”来表示,而最佳的匹配应同时考虑 顶点特征矢量的匹配和相对几何位置的匹配。

35

广西大学毕业设计论文

人脸识别系统

图 4-4 表示人脸特征的二维矢量 由图 4-5(和图 4-4 一样,它们的每一顶点均为一特征矢量)可见,特征 匹配即: si 上的顶点 i 与 s 中相对应的顶点 j , j ? M (i ) , M 为匹配函数) , 其特征的匹配度则表示 i 和 j 顶点的特征矢量相似度,而几何位置的匹配则 为 s 中相近的两顶点,匹配后, si 中对应的两顶点也应该相近,用了以下能 量函数 E(M)来评价待识别人脸图像矢量场和库中已知人脸的矢量场之间的 匹配程度。
S1

S

图 4-5 定义在已知脸和待识别脸上的二维网格 s 和 si

? ? Ci , X j ? ? E (M ) ? ? ?? ? ? ? ?[(i1 ? i2 ) ? ( j1 ? j2 )]2 i ? i1,i2 ? Ci X j ? ?

(4-3)

上式中的第一项是计算两个矢量场中对应的局部特征 X j 和 Ci 的相似程 度,第二项则是计算局部位置关系和匹配次序。由此可见,最佳匹配也就是
36

广西大学毕业设计论文

人脸识别系统

最小能量函数时的匹配在求能量函数实现匹配的时候,可以有如下两种匹配 的方法:其中一种是严格的匹配方法;另一种匹配即所谓弹性图匹配方法。 网格经过了变形, 即由原来网格 s 中的一点对 s 中一点的严格匹配, 变成了 s 中一点和 si 中一点了;邻域范围内的匹配,其目的是为了进一步减小能量函 数,通过最终收敛到一个最小值,来实现弹性匹配正是这样的匹配容忍了表 情的细微变化。

37

广西大学毕业设计论文

人脸识别系统

第五章 基于局部特征分析与最优化匹配的人脸 识别算法
生物学的研究表明 2D Gabor 小波[8]是对高级脊椎动物视觉皮层中的神 经元的良好逼近,是对时域和频域精确度的一种折中。因此利用 2D Gabor 小波变换的系数幅值作为特征有着良好的视觉特性和生物学背景。本章结合 神经网络用于人脸特征定位、Gabor 小波的局部多尺度分析特性和特征点子 空间上的最优化匹配方法进行人脸识别,取得了较好的效果。

5.1 图像预处理
1.对人脸图像进行缩放到 64×64 大小。 2.对缩放后的人脸图像进行基于小波和神经网络的光照补偿。

5.1.1 人脸图像特征点定位
在我们的系统中我们选择了 15 个特征点,如图 5-1 所示:

图 5-1 人脸特征点分布图 在特征点的定位上,我们使用了六个 BP 神经网络进行特征点定位。其 中第一个用于瞳孔的定位, 第二个用于眼角的定位, 第三个用于眉心的定位, 第四个用于眉角的定位,第五个用于鼻尖的定位,第六个用于嘴角的定位。 定位方法以瞳孔为例,我们首先采集一些瞳孔样本和非瞳孔样本送入瞳孔定 位神经网络进行分类训练。瞳孔样本的输出为 1,非瞳孔样本的输出为-1。 之后使用瞳孔定位神经网络进行瞳孔定位,如果定位错误我们将这个反例再 次送入神经网络学习,这样经过多次的反复学习训练,瞳孔定位神经网络就 具备了瞳孔定位的能力,其他定位神经网络的训练以此类推。

5.1.2 利用 Gabor 小波提取人脸局部的多尺度特征
Gabor 小波是小波的一种,这是它的公式:
38

广西大学毕业设计论文

人脸识别系统

? k 2 x2 ? ? ? ? 2 ?? j ? ? j ( x) ? 2 exp ? ? exp( ik x ) ? exp ? ? ? ?? j ? ? 2? 2 ? ? ? 2 ?? ? ? k2 j
这里

x ? ( x, y);

? k jx ? ? kv cos ?? ? kj ? ? ? ? ? ? ? k jy ? ? kv sin ?? ?
kv ? 2
v?2 2

?;

?v ? ?

?
8

;

这里 ? 为 Gaussian 的标准方差,v 为频率参数, ? 为方向参数。 从外形上看, Gabor 小波被封装在一个 Gaussion 分布的形状中, 而且它 的积分为零。 如果要将 Gabor 小波在三维中显示出来, 应该是下面这个样子,
(a)是实部(偶函数) ,(b)实部是虚部(奇函数) ,如图 5-2 所示。

(a)实部

(b)虚部

图 5-2 Gabor 的图像 通过改变频率参数 v 和方向参数μ ,可以得到一组不同的 Gabor 滤波 器。出于速度和效果的综合考虑,一般使用 8 个方向和 5 种频率,这样,一 共可以产生 5×8=40 个不同的 Gabor 滤波器。对于大小为 64×64 的图像, 最小和最大频率的波长分别为 8 和 2 个象素。将人脸图像的每一个特征点分 别与每一个 Gabor 滤波器做卷积,会得到 40 个结果(注意:实部和虚部必 须分开才能做卷积) 。对人脸图像的每一个特征点而言,则会产生 40 个输出 的复数, 这 40 个输出的复数就代表了这个特征点局部的多尺度 Gabor 特征, 我们将这 40 个复数的实部和虚部分别单位化并按滤波器的顺序排列好组成
39

广西大学毕业设计论文

人脸识别系统

这个点的特征向量。

5.1.3 局部特征的最优化匹配
局部特征的最优化匹配是通过局部特征的特征向量最优化匹配来实现 的 。一般来说,人脸库中属于同一个人的人脸有多张(例如不同表情、不 同光照、不同姿势、不同时期的人脸等) ,这些同一个人的每张人脸相同位 置特征点所对应的特征向量张成了一个线性子空间(例如:同一个人每张人 脸左眼瞳孔特征点所对应的特征向量张成了一个左眼瞳孔的线性子空间) 。 这样同一个人的人脸有多少个特征点就张成了多少个相应的线性子空间。将 待识人脸与人脸库的每一张人脸计算相似度
[8] [8]

,并在人脸库中找出与待识人

脸有最大相似度的人脸作为识别结果。显然这种方法没有利用特征点的特征 向量张成线性子空间所内含该特征点的共性。我们的方法则充分利用了 Gabor 小波优良局部特征分析的优点和特征向量张成线性子空间所内含该 特征点的共性。通过最优化的方法在人脸库中每个人(注:不是每张脸,一个 人可有多张脸)每个特征点对应的线性子空间中找到这样一个最优特征向 量,这个最优特征向量向待识人脸相应特征点所对应特征向量的投影值最 大。

? A1T ? ? a1i ? ? c1 ? ? x1 ? ? T? ? ? ? ? ? ? ? A2 ? ? a2i ? ? c2 ? ? x2 ? ? . ? ? . ? ? . ? ? . ? 记 Ai ? ? ? ; A ? ? ? ;C ? ? ?; X ? ? ?; m ? n ? . ? ? . ? ? . ? ? . ? ? ? ? . ? ? . ? ? . ? . ? ? ? ? ? ? ? ?a ? ?c ? ?x ? ? ? AT ? m ? mi ? ? ? ? n? ? n ?
其中: 。 m 为某特征点的维数(在这里 m ? 40 )

T

n 为该特征点对应子空间的维数。
Ai 为人脸库中第 i 人该特征点所对应的特征向量。
C 为待识人脸某特征点所对应的特征向量。 X 为未知量。其意义为最优特征向量在其子空间中的坐标。 并且满足 Ai ? 1、 C ? 1 , A1 , A2 ,? An 线性无关。
40

广西大学毕业设计论文

人脸识别系统

于是我们的问题就转化为求得以下函数的极值:
f (X ) ? ( AX )T C ( AX )T ( AX )

(5.1)

两边求导可得:
?f ( X ) AT C ( AX )T C ? ?2 AT AX T T T ?X ( AX ) ( AX ) ( AX ) ( AX ) ( AX ) ( AX )

(5.2)



?f ( X ) ? 0 得: ?X

AT AX ?

( AX )T ( AX ) T AC ( AX )T C

(5.3)

由 A1 , A2 ,? An 线性无关:故 AT A 为一是对称的正定矩阵,由此得:

X?


( AX )T ( AX ) T ?1 T ( A A) A C ( AX )T C

(5.4)

? b1 ? ? ? ? b2 ? ? .? B ? ? ? ? ( AT A) ?1 AT C ? .? ? .? ? ?b ? ? ? n?

(5.5)

? 1 ? ? 1 ? ? ? ? ? b ? x1 ? ? ? 1 ? x2 ? ? b2 ? ? ? ? ? ? x1 ? ? b1 ? ? x2 ? ? b2 ? ? . ? ( AX )T ( AX ) ? . ? ? . ? ? . ? X ? ? ? ? x1 ? ? x ?? ? ? ? 1? ( AX )T C ? . ? ? . ? ? . ? ? . ? ? . ? ? . ? ? . ? ? .? ? ? ? ? ? ? ? ? ?x ? ?b ? ? xn ? ? bn ? n? ? n? ? ? x? ? b? ? 1? ? 1?
41

广西大学毕业设计论文

人脸识别系统

? 1 ? ? ? ? b2 ? ? b1 ? X1 ? ? . ? ? ? ? . ? ? . ? ? ?b b ? ? ? n 1?

(5.6)

? x1 ? ? b1 ? ? b1 ? ? b1 ? ? ? ? ? ? ? ? ? ? x2 ? ? b2 ? ? b2 ? ? b2 ? ? .? ( AX )T ( AX ) ? . ? x12 ( AX 1 )T ( AX 1 ) ? . ? x1 ( AX 1 )T ( AX 1 ) ? . ? X ? ? ? ? x1 .? ? ? ? ?? ? ? (5.7) ( AX )T C ? . ? x1 ( AX 1 )T C ? . ? x1 ( AX 1 )T C ? . ? ? .? ? .? ?.? ?.? ?.? ? ? ? ? ? ? ? ?x ? ?b ? ?b ? ?b ? ? ? n? ? n? ? n? ? n?
故当

? x1 ? ? b1 ? ? ? ? ? ? x2 ? ? b2 ? T ? . ? ( AX 1 ) ( AX 1 ) ? . ? X ? ? ? ? x1 ? ? ( AX 1 )T C ? . ? ? . ? ? . ? ? .? ? ? ? ?x ? ?b ? ? ? n? ? n?

(5.8)

f (X ) ?
约束条件

( AX )T C 取得极值,其中 x1 为自由变量( x1 ? 0 ) 。 将 X 代入 ( AX )T ( AX )
X ? 1 或 x1 ? x2

则 AX 就是我们要求 ? ...... ? xn ? 1 即可求得 x1 和 X。

得的最优特征向量。

5.2 人脸匹配识别
在系统中设定了两种阈值与权值。一种是局部特征点阈值与权值,给每 个特征点设置了不同的阈值与权值,左右眼的瞳孔、眉心给予了最大的阈值 与权值,每只眼的左右眼角、眉角给予了稍小的阈值与权值,鼻尖次之,因 为嘴角的变化较大所以被给予阈值与权值最小。这种阈值要求每个特征点的
42

广西大学毕业设计论文

人脸识别系统

相似度都要超过它。二是整体阈值,这种阈值要求对各特征点的阈值加权后 要超过它。匹配的同时满足以上条件才能确认识别结果。

图 5-3 Yale 库的部分人脸

5.3.实验结果
实验对 Yale 大学的人脸库和 ORL 人脸库做了测试。Yale 大学的人脸库 包含了 15 个人,每个人有 11 张图片,其中包括了在不同光照条件下(如左 逆光、右逆光)、不同表情、戴眼镜的人脸图像。Yale 大学的人脸库中一个 人的图像如图 5-3 所示,选择了每个人正常、左侧光、右侧光的三幅图像作 为训练集,其余的图像作为测试集。ORL 人脸库包含 40 个人,何个人有 10 张图片分别对应不同的光照、姿态、表情,这些图之间的差别比较大。ORL 大学的人脸库中一个人的图像如图 5-4 所示,把其中三幅作为训练集,另外 7 幅作为测试集, 同时, 通过用 MATLAB 编程实现相关算法并进行人脸识别实 验,实验结果如表 2 所示。 表 2 测试结果
人脸图像库 Yale 人脸库 ORL 人脸库 识别率 94.2% 84.6%

43

广西大学毕业设计论文

人脸识别系统

图 5-4 ORL 库的部分人脸

44

广西大学毕业设计论文

人脸识别系统

第六章 基于 ARM 的人脸识别系统设计
本章介绍了 CMOS 图像传感器、ARM 微处理器等仪器器件的特点,利用 S3C2410 实验板等仪器器件实现了人脸识别系统设计。 6.1 CMOS 图像传感器简介 CMOS 图像传感器是 20 世纪 70 年代在美国航空航天局(NASA)的喷气 推进实验室(J PL)诞生的 ,与 CCD 图像传感器几乎同步。标准 CMOS 大规模 集成电路技术的不断发展大大改善了 CMOS 图像传感器的图像质量。CMOS 图 像传感器的高度集成化减小了系统的复杂性 ,降低了制造成本 , 仅为普通 CCD 图像传感器的 1/ 20 ,对获得的图像信息读出及处理变得简单而快捷 , 能设计出更灵巧的小型成像系统。它具有单一工作电压、 功耗低、 像素缺 陷率低、 可与其他 CMOS 集成电路兼容、 对局部像素图像的编程可随机访 问等优点。因此,本文采用基于 CMOS 的图像处理芯片。如图 6-1 所示。

图 6-1 CMOS 光电管阵列图像传感器(300nm-1000nm) OV7620 简介
[20]

OV7620 是美国 Omnivision 公司生产的一款高集成度高分辨率图像传感 器,它将所有摄像功能和矩阵处理功能都集成在片上. OV7620 是完全可编程 的数字单片摄像器件, 其像矩阵为 640×480 象素( 30 万像素), 也可按 320 ×240 象素输出 GIF 图像格式( 8 万像素)。片上 A/ D 转换器可提供 8 位或 16 位并行数字输出,并 100%符合 CCIR601/656 规范. 可以利用 OV7620 的 SCCB( Serial Camera Control Bus ) 接口来对 OV7620 完成进行有关设 置和读取图像数据,OV7620 芯片引脚如图 6-2 所示。

45

广西大学毕业设计论文

人脸识别系统

图 6-2 OV7620 芯片引脚 OV511 是 Omnivision 公司生产高性能摄像机到 USB 接口单片控制芯片, 它极大地简化了单片 CMOS 图像传感器和 USB 的接口, 其片上增加 256K DRAM 和一个 USB 收发器, 可以很容易地构成基于 USB 的视频子系统。 OV511 最 大视频传输速度的设计, 使得系统能够以更加实时的方式获取大量的视频 信息。 片内高性能专用压缩引擎可以达到 7:1 的压缩比,保证了从图像传 感器到主控制器的快速图像传输,从而减少了低带宽应用中通常会出现的图 像跳动现象。快速的准同步 FIFO 保证了压缩后视频图像从压缩引擎到 USB 的高速传输。OV511 芯片引脚如图 6-3 所示。OV511 芯片

46

广西大学毕业设计论文

人脸识别系统

图 6-3 OV511 芯片引脚 USB 接口简介 USB 的全称是 Universal Serial Bus,USB 支持热插拔,即插即用的优 点,所以 USB 接口已经成为 MP3 的最主要的接口方式。USB 有两个规范,即 USB1.1 和 USB2.0。 USB1.1 是目前较为普遍的 USB 规范,其高速方式的传输速率为 12Mbps, 低速方式的传输速率为 1.5Mbps (b 是 Bit 的意思) , 1MB/s (兆字节/秒) =8MBPS (兆位/秒) ,12Mbps=1.5MB/s。USB2.0 规范是由 USB1.1 规范演变而来的。 它的传输速率达到了 480Mbps,折算为 MB 为 60MB/s,足以满足大多数外设 的速率要求。本文设计的系统要采集和传输图像,由于图像占的字节大,高 速的的 USB2.0 满足条件。
47

广西大学毕业设计论文

人脸识别系统

USB 接口的作用 USB 接口部分需要完成摄像头信息检测, 数据格式的转化处理, OV511 与 OV7620 的控制字配制以及内核注册等工作。USB2.0 的接口电路如图 6-4 所示。

图 6-4 USB2.0 的接口电路

6.2.ARM9 介绍

[18]

ARM 是英国一家知名微处理器企业,是 Advance RISC Machines 的缩写, 该公司专门从事基于 RISC 技术的芯片设计开发。 ARM 公司的处理器具有性能 高、成本低和能耗小的特点,适用于多种领域,如嵌入式控制、消费/教育 类多媒体、DSP 和移动式应用等。 ARM9 系列处理器是英国 ARM 公司设计的主流嵌入式处理器,主要包括 ARM9TDMI 和 ARM9E-S 等系列。 新一代的 ARM9 处理器通过全新的设计, 采用 更多的晶体管,能够达到两倍以上于 ARM7 处理器的处理能力 这种处理能力 的提高是造过增加时钟频率和减少指令执行周期实现的。因此,本文采用了 基于 ARM9 的 S3C2410 原理及引脚(如图 6-5 所示)进行人脸识别系统的设 计。
48

广西大学毕业设计论文

人脸识别系统

ARM 微处理器的特点 采用 RISC 架构的 ARM 微处理器一般具有如下特点: (1)体积小、低功耗、低成本、高性能; (2)支持 Thumb(16 位)/ARM(32 位)双指令集,能很好的兼容 8 位 /16 位器件; (3)大量使用寄存器,指令执行速度更快; (4)大多数数据操作都在寄存器中完成; (5)寻址方式灵活简单,执行效率高; (6)指令长度固定; Samsung S3C2410 微处理器简介[24] S3C2410 是由三星公司推出的一款基于 ARM9 内核的 32 位处理器, S3C2410 是 ARM9 系列中非常优秀的一款处理器, 应用广泛, 有着较大的用户 群体。

49

1

2

3

广西大学毕业设计论文
VDD33V R35 1K D1 LED

人脸识别系统
nDIS_OFF GPB6 nGCS0 GPA12 nGCS2 nGCS3 GPA15 nGCS5 nOE OM0 OM1 nWE

VDD33V

R34 1K D2 LED

R5 10K R20 nWAIT

G 1 G 57 D 1 E 15 E 16

G 13 E 13

R 14 U 15

E 14 E 17 F 15 C 16

H 2 G 2 H 3

H 4

nXDREQ1 nXDREQ0 nXDACK1 nXDACK0
n X D A C K 0 /G P B 9 X DR A /G PB nnX D EC QK 01 /G PB 17 0 n X D R E Q 1 /G PB 8

n X B A CK / G P B 5 n X B R E Q /G P B 6

n G C S 1 /G P A 1 2 n G C S 2 /G P A 1 3

n G C S 3 /G P A 1 4 n G C S 4 /G P A 1 5 n GC S0 n G C S 5 /G P A 1 6

U1A
n W AI T n OE nW E O M0 O M1

X pl l O T MI 2 X T O p ll O M TC L3 K 1/ E I N T 1 9/ G P G 11 T O U X TI rT t c0 / G PB 0

A IN CL L K5 O U U T T1 0 /G /G P PH H1 90 C K O A IN 6 A IN 7

J1 1 R 12 U 12 P 17 L 13

T 1 / G PB 1 XO TU O T r tc T O U T 2 / G PB 2 T O U T 3 / G PB 3 T CL K 0/ G P B 4

M PL L C A P U PL L C A P

VX r eTf C L K E

ADDR0 ADDR1 ADDR2 ADDR3 ADDR4 ADDR5 ADDR6 ADDR7 ADDR8 ADDR9 ADDR10 ADDR11 ADDR12 ADDR13 ADDR14 ADDR15 ADDR16 ADDR17 ADDR18 ADDR19 ADDR20 ADDR21 ADDR22 ADDR23 ADDR24 ADDR25 ADDR26

B14 D14 A14 C13 B13 D13 A13 C12 B12 G12 D12 E12 B11 A11 C11 G11 A10 B10 E10 D10 F10 A9 D9 E9 B9 C9 E8

ADDR0/GPA0 ADDR1 ADDR2 ADDR3 ADDR4 ADDR5 ADDR6 ADDR7 ADDR8 ADDR9 ADDR10 ADDR11 ADDR12 ADDR13 ADDR14 ADDR15 ADDR16/GPA1 ADDR17/GPA2 ADDR18/GPA3 ADDR19/GPA4 ADDR20/GPA5 ADDR21/GPA6 ADDR22/GPA7 ADDR23/GPA8 ADDR24/GPA9 ADDR25/GPA10 ADDR26/GPA11
A IN 0

S3C2410

DATA0 DATA1 DATA2 DATA3 DATA4 DATA5 DATA6 DATA7 DATA8 DATA9 DATA10 DATA11 DATA12 DATA13 DATA14 DATA15 DATA16 DATA17 DATA18 DATA19 DATA20 DATA21 DATA22 DATA23 DATA24 DATA25 DATA26 DATA27 DATA28 DATA29 DATA30 DATA31

A A A A

IN IN IN IN

1 2 3 4

B8 A8 D7 E7 C7 B7 A7 C6 F7 B6 D6 A5 C5 B5 D5 A4 A3 B3 A2 A1 B2 C3 B1 C2 C1 D2 D4 D1 E3 E2 E4 E1

DATA0 DATA1 DATA2 DATA3 DATA4 DATA5 DATA6 DATA7 DATA8 DATA9 DATA10 DATA11 DATA12 DATA13 DATA14 DATA15 DATA16 DATA17 DATA18 DATA19 DATA20 DATA21 DATA22 DATA23 DATA24 DATA25 DATA26 DATA27 DATA28 DATA29 DATA30 DATA31

F2 F1 F4 G 3

R 15 T 17 R 16 N 13

N 12

U 14 T 13 H 17 H 16 P 16

AIN0 AIN1 AIN2 AIN3 AIN4 AIN5 AIN6 AIN7 Vref VDD33V VDD33V R19 0

U T U T

G 4 R 11

16 15 17 16

R 17

XTOrtc XTIrtc XTIpll XTOpll OM3 OM2

EINT19 L3CLOCK L3DATA L3MODE GPB1PWM GPB0

C7 0.1uF R21 0

GND

WP_SD GPG10

C6 NC VDD33V

C5 NC

EXTCLK

图 6-5

S3C2410 原理及引脚图
50

Title

Size A4 Date: File:

Number

17-Jun-2008 D:\桌面杂物\原理图\protel原理图

1

2

3

广西大学毕业设计论文

人脸识别系统

S3C2410 核心板的特点如下: CPU 最高上频达 266MHz; 板载 4/8/16/32 Mb NOR Flash(选配),可方使扩充 32/64/128/256/512 1024bNAND Flash; 主存 SDRAM 可选 16/32/64Mb; 采用六层饭 PCB 设计,稳定可靠; 可选择使用 NAND Flash 启动或者使用 NOR Flash 启动 能够根据客户需求基于该核心板进行速度快捷、费用合理的二次开发; 提供多功就开发板 核心板的接口都有: S3C2410 集成通用 LCD 控制器,兼容从单色到真彩、 分辨率 2048×1024 以内的液晶屏幕; 21 位(A0~A19,A24)地址总线和 16 位数据总线; 8 按键键盘接口; SMC/NAND Flash 接口; I2C、UART、SPI 等串行接口; 两个 USB1.1 接口; JTAG 编程、仿真接口; 7 个外部中断信号; 3.3V 单电源供电接口; 7 个 10 位 ADC 信号接口; 触摸屏接口; 基于 S3C2410 的串口通信[19] 通信:是指利用一条传输线将资料一位位地顺序传送。特点是通信线路 简单,利用简单的线缆就可实现通信,降低成本,适用于远距离通信,但传 输速度慢的应用场合。 异步通信及其协议 异步通信以一个字符为传输单位,通信中两个字符间的时间间隔是不固 定的,然而在同一个字符中的两个相邻位代码间的时间间隔是固定的。 通信协议(通信规程) :是指通信双方约定的一些规则。在使用异步串 口传送一个字符的信息时, 对资料格式有如下约定: 规定有空闲位、 起始位、
51

广西大学毕业设计论文

人脸识别系统

资料位、奇偶校验位、停止位。如图 6-6。

图 6-6 串口通信时序

其中各位的意义如下: 起始位:先发出一个逻辑”0”信号,表示传输字符的开始。 资料位:紧接着起始位之后。资料位的个数可以是 4、5、6、7、8 等, 构成一个字符。通常采用 ASCII 码。从最低位开始传送,靠时钟定位。 奇偶校验位:资料位加上这一位后,使得“1”的位数应为偶数(偶校验) 或奇数(奇校验),以此来校验资料传送的正确性。 停止位:它是一个字符数据的结束标志。可以是 1 位、1.5 位、2 位的高 电平。 空闲位:处于逻辑“1”状态,表示当前线路上没有资料传送。 波特率:是衡量资料传送速率的指针。表示每秒钟传送的二进制位数。 例如资料传送速率为 120 字符/秒,而每一个字符为 10 位,则其传送的波特 率为 10×120=1200 字符/秒=1200 波特。 串口引脚 RS-232、RS-422 与 RS-485 都是串行数据接口标准,最初都是由电子工 业协会(EIA)制订并发布的。由于 RS-485 是从 RS-422 基础上发展而来的, 所以 RS-485 许多电气规定与 RS-422 相仿,却具有 RS-232 无法比拟的优点。 S-485 可以采用二线与四线方式,二线制可实现真正的多点双向通信,如图 6-7 所示。

52

广西大学毕业设计论文

人脸识别系统

图 6-7 RS-485 引脚连接 RS-485 接线端子引脚分配如表 6-1 所示 表 6-1 RS-485 接线端子引脚分配 信号定义 RS-485 半双工接线 接线端子(PIN) 1 2 S3C2410 内置的 UART 控制器 S3C2410 内部具有 3 个独立的 UART 控制器,每个控制器都可以工作在 Interrupt(中断)模式或 DMA(直接内存访问)模式,也就是说 UART 控制 器可以 CPU 与 UART 控制器传送资料的时候产生中断或 DMA 请求。并且每个 UART 均具有 16 字节的 FIFO(先入先出寄存器),支持的最高波特率可达到 230.4Kbps,如表 6.2、6.3 所示。 表 6.2 UATR 寄存器设置 寄 存 器 ULCON 0 ULCON 1 ULCON 2 寄存器 ULCON0 ULCON1 ULCON2 0 地 址 0 0X5000800 W R/W R/W R/W R/W
53

T/R+ T/R-

RS-485(A+) RS-485(B+)

其中,T(TXD)发送数据,R(RXD)接收数据



址 W

R/ R/ W R/ W R/

描述 UARTchannel0lin e control register UARTchannel1lin e control register UARTchannel2lin e control register 描 述

复位值 0x00 0x00 0x00

0X5000000 0 0X5000400

表 6.3 UATR 控制寄存器设置

复位值 0x00 0x00 0x00

0X50000004 0X50004004 0X50008004

UARTchannel0line control register UARTchannel1line control register UARTchannel2line control register

广西大学毕业设计论文

人脸识别系统

UART 初始化 #define UART_BPS 115200 void UART0_Init(void) { uint16 Fdiv; U0LCR = 0x83; Fdiv = (Fpclk / 16) / UART_BPS; U0DLM = Fdiv / 256; U0DLL = Fdiv % 256; U0LCR = 0x03; } // DLAB = 1,可设置波特率 // 设置波特率 // 定义通讯波特率

6.3 人脸识别系统的硬件设计
人脸识别系统上位机的任务是:扫描键盘是否有按键按下,如果有按键 按下则根据按键执行命令,通过 UART 未处理器控制命令,之后通过液晶屏 显示执行结果。人脸识别系统(系统的各个模块引脚图已经给出,只要按引 脚及相应的接口连接即可)的硬件结构图如图 6-8 所示:
液晶显示

视频图像采集 (OV7 6 2)

图像处理单元 (O V51 1)

ARM9 (S3C2410)

人脸数据库 (SD卡)

键盘

图 6-8 人脸识别系统硬件结构图 图像采集及处理电路 图像采集及处理单元的系统框图如图 6-9 所示下:
54

广西大学毕业设计论文

人脸识别系统

OV7620

图像信号 图像数据

OV511 控制信息 S3C2410 LCD显示屏

电源 控制信息

图像信息 SD卡

图 6-9 图像采集及处理系统框图 其中 OV7620 是实现图像的采集,OV511 实现图像的转换压缩和传送[20]。 图像采集及处理工作原理与过程 由 OV7620 来采集图像,对于其相关设置和图像数据读取可以通过 SCCB 接口来完成. 本系统采用的 OV7620 工作模式是: 最高 30 帧 /秒的速度、输 出分辨率为 640 × 480、 图像数据流为 16 位 RGB 格式。 SCCB 接口控制方式 是通过 SCCB 接口,对状态控制寄存器直接进行读写控制,达到需要的工作 状态。 OV511 提供 OV7620 所需的各种控制信号, 并接收来自 OV7620 的同步输 出信号。 OV511 将输人图像数据经片内图像压缩转换器,将 RGB 的图片转 换成 bmp 格式并压缩, 通过内置的 USB 控制器和外接的 USB 收发器经 USB 总线送传发给 S3C2410, 保证了数据的快速实时性。S3C2410 通过 USB 配置 OV511,OV511 则对 7620 的控制字进行配置。 S3C2410 内部集成有 USB 控制芯片, 所以它可以对 OV511 通过 USB 接 口直接操作:S3C2410 自带的 64M 内存,存放人脸检测和识别的子程序。系 统上电时,首先检测采集的 bmp 格式的图像中是否存在人脸图像,如果存在 人脸图像 S3C2410 则按人脸检测子程序要求进行预处理后提取人脸图像特征 的信息, 再根据人为给定的操作命令信息进行处理。 如果给定命令要求存库, 则把该人脸图像特征信息通则特征存入人脸数据库(SD 卡)中;如果命令要 求识别,则把这张图像信息和人脸数据库中的人脸信息进行快速的对比匹配 识别,识别结果则由 S3C2410 通过对 I/O 口进行控制来实现图像的存储并通 过其片内 LCD 控制器来实现图像在 LCD 显示屏上的显示, 并且表明识别结果。 OV7620、OV511 和 S3C2410 的连接接口框图如图 6-10 所示。
55

广西大学毕业设计论文
USB接口

人脸识别系统

OV7620
USB 接口

OV511
USB 接口 USB 接口

S3C2410
图 6-10 人脸数据库 采集到的人脸数据信息,由 SDRAM 芯片进行存储,三星公司 S3C2410 微 处理器,其内部有一个可编程的 16 位或者 32 位宽的 SDRAM 接口,允许连接 一块 SDRAM 容量 1Gbit。有了 SDRAM 控制器,只要选取标准的 SDRAM 芯片, 按 接 口 电 路 连 接 起 来 就 可 以 了 。 本 文 选 择 三 星 公 司 的 32 位 容 量 为 1GbitMSDRAM,当然,如果需要,还可以对数据库进行扩充[23]。SDRAM 模块 原理及引脚如图 6-11 所示。 OV7620、OV511 和 S3C2410 的连接接口框图

56

广西大学毕业设计论文

人脸识别系统

图 6-11 SDRAM 模块原理及引脚图 LCD 显示电路
[21]

LCD 是 Liquid Crystal DisPlay 的缩写,即液晶显示。具有信息量大、 整洁美观点特点,市面上出售的 LCD 有两种类型: 一种是带有驱动电路的 LCD 显示模块, 另一种是 LCD 显示屏。 第一种 LCD 可以方便地与各种低档单片机进行接口。LCD 显示屏没有驱动电路,需要与 驱动电路配合使用。特点是体积小,却另需驱动芯片。也可以使用带有 LCD 驱动能力的高档 MCU 驱动, 如 ARM 系列的 S3C24100。 本系统选用液晶显示屏 作为人机交互的界面。 S3C2410 中具有内置的 LCD 控制器,它具有将显示缓存(在系统存储器 中)中的 LCD 图像数据传输到外部 LCD 驱动电路的逻辑功能。S3C2410 中内 置的 LCD 控制器可支灰度 LCD 和彩色 LCD。即 S3C2410 内部已经集成了 LCD 控制器,因此可以很方便地去控制各种类型的 LCD 屏,例如:STN 和 TFT 屏。
57

广西大学毕业设计论文

人脸识别系统

由于 TFT 屏将是今后应用的主流,因此接下来,重点围绕 TFT 屏的控制来进 行。 S3C2410 LCD 控制器的 TFT 屏特性: TFT 屏 -支持单色、4 级灰度、256 色的调色板显示模式 -支持 64K 和 16M 色非调色板显示模式 -支持分辨率为 640*480,320*240 及其它多种规格的 LCD。 本文显示模块采用 LQ080V3DG01,它是 Sharp 公司的 TFT-LCD, 其分辨 率为 640×480。时序图如图 6-12 所示,时间参数如表 6.4 所示。
表 6-4 LQ080V3DG01 的时序参数 参数 帧周期 垂直显示时间 行扫描时间 水平显示时间 符号 数值 16.8 单位

T1 T2 T3 T4

ms

480 ? T 3

800 ? tc ? 32 640 ? tc

?s

Hsync

H vh

Vsync

(a)垂直操作时序

58

广西大学毕业设计论文

人脸识别系统

Hsync

CLK

H hc

DATA R0~R5,G0~G5,B0~B5

Dcd Ddc
(b) 水平操作时序
DENB
T 1

T 2

T3
DENB 1 480 1 2 3

T 4

(c) DENB 时序 图 6-12 LQ080V3DG01 的主要操作时序 S3C2410 中的 LCD 外部接口信号 VFRAME/VSYNC/STV:帧同步信号(STN)/垂直同步信号(TFT)/SEC TFT 信 号; VLINE/HSYNC/CPV:行同步脉冲信号(STN)/水平同步信号(TFT)/SEC TFT
59

广西大学毕业设计论文

人脸识别系统

信号; VCLK/LCD_HCLK:像素时钟信号(STN/TFT)/SEC TFT 信号; VD[23:0]:LCD 像素数据输出端口(STN/TFT)/SEC TFT 信号; VM/VDEN/TP:LCD 驱动器 AC 信号(STN)/数据使能信号(TFT)/SEC TFT 信 号; LEND/STH:行结束信号(TFT)/SEC TFT 信号; LCD_PWREN:LCD 电源使能控制信号; LCDVF0:SEC TFT 信号 LCDVF1:SEC TFT LCDVF2:SEC TFT 信号 OE; REVB。 信号 REV;

总共有 33 个输出端口:24 个数据位和 9 个控制位。 在该显示系统的硬件电路中,S3C2410 与 LCD 模块的连接是关键, S3C2410 内部自带一个 LCD 驱动控制器, 其接口可以与单色、 灰度、 彩色 STN 型和彩色 TFT 型的 LCD 直接相连,但需要根据所连接的 LCD 的类型设置相应 寄存器中的显示模式。 LQ080V3DG01 要求其电源电压 Vdd 典型值为 3.3V/5V, 并且 LCD 数据和控制信号的高电平输入电压 ViH 在 2.3~5.5V 范围内,低电 平输入电压 ViL 则在-0.3~0.9V 范围 内,故可以直接与 S3C2410 相连,其 电路图如图 6-13 所示。
S3C2410
VD23~VD19 VD15 ~VD11 VD7~VD3 VCLK VDEN HSYNC VSYNC LQ080V3DG01 R4~R0 G5~G0 B4~B0 CK ENAB Hsync Vsync

图 6-13 S3C2410 与 LQ080V3DG01 的连接图 系统软件设计 S3C2410 处理器中的 LCD 控制器内含寄存器 LCDCOM1-LCDCON5。 对于 LQ080V3DG01,这些寄存器的具体设置如下:
60

广西大学毕业设计论文

人脸识别系统

(1)在 LCDCON1 中,CLKVAL 是时钟参数,对于 LQ080V3DG01, 该域值取 1。PNRMODE 是显示模式参数,该域值取 3,表示所用模块 是 TFT 型, BPPMODE 是每个象素的数据位数参数, 对于 LQ080V3DG01 模块, 设计时可设置成 16bpp,所以此域值取 12。 (2)在 LCDCON2 中,VBPD 对应于表 1 中的 H 参数,该域值取 32。 LINEVAL 对应于表 1 中的 I 参数,该域值取 479,VFPD 对应于表 1 中的 J 参数,该域值取 9,VSPW 对应于表 1 中的 G 参数,该域值取 1。 (3)在 LCDCON3 中,HBPD 对应于表 1 中的 C 参数,该域值取 47。 HOZVAL 对应无于表 1 中的 D 参数,该域值取 639,HFPD 对应于表 1 中的 E 参数,该域值取 15。 (4)在 LCDCON4 中只需要设置 HSPW 即可,它对应于表 1 中的 B 参 数,该域值取 95。 (5) LCDCON5 中, BPP24BL 用于决定 24bpp 视频存储器的大小端模式, 该域值取 0,FRM565 决定 16bpp 视频输入数据的格式。 根据上面对 L C D 各主要寄存器设置的分析得出的结果, 开发了基于 FrameBuffer 机制的 S3C2410fb 驱动程序。 下面是经过调试成功的部分代码, 作用是对显示屏幕初始化和设置 L C D 控制寄存器的值。 /*s 3 c 2 4 1 0 f b . c*/ static struct initdata= { pixclock: 174757,bpp . 1 6,x res:640, yres: 480,hsync _ len: 96,vsync _len:2,left - margin: 40,upper - margin : 24, right margin: 32,lower - margin : I1,sync: 0,cmap _ static : l , reg.{//设置 LCD 控制寄存器的值 lcdconl : LCDI BPP_16TI LCDI PNR-TFT} LCDI_ CLKVAL(1),lcdcon2: LCD2_VBPD(32) I LCD2_VF PD(9) }LCD2 VSPW(l) , lcdcon3 :LCD3_HBPD(47)} LCD3_HFPD(15),lcdcon4:LCD4_HSPW(95){LCD4_MVAL(1),lcdcon5: LCD5_FR M565}LCD5_INV VLINE}
61

s3c2410fb _ mach _info xxx_stn_info_ _

LCD5_INVVFRAMEI LCD5_HWSWP}LCD

广西大学毕业设计论文

人脸识别系统

5_ PWREN, } , } ; 按照本文所设计的接口连接好硬件后,修改了 S3C2410 的驱动程序,经 编译整个系统后再重新写到 Flash 中,重启后能正确显示原系统的静态启动 画面,并且画面清晰稳定,达到了预期的效果。 复位电路 系统复位模块提供给 S3C2410 启动信号,是整个系统运行的开端。 S3C2410 的复位信号为 RESET,如它有效,系统复位将内部产生。RESET 挂 起程序,放 S3C2410,放 S3C2410 进复位状态。在电源打开已经稳定时, RESET 必须保持低电平至少 4 个 MCLK 周期。本系统利用容阻电路设计的 复位电路,如图 6-14 所示。

6-14 复位电路图 如图 6-14 所示,该复位电路的工作流程为:系统上电时,通过 R1 向电 容充电, 当 C1 两端的电压未达到高电平的门限电压时, RESET 端输出为低电 平,系统处于复位状态;当 C1 两端的电压达到高电平的门限电压时,RESET 端输出为高电平,系统处于正常工作状态。 当用户按下按钮 S1 时,C1 两端的电荷被泄放掉,RESET 端输出为低电 平,系统进入复位状态,再重复以上的充电过程,系统进入正常工作状态。 键盘电路 本系统使用 4 个按键进行人机交互,4 个按键的功能分别为添加用户、 识别用户、选择用户、删除用户。键盘电路如图 6-14 所示。 由于按键按下时会产生微小的震动,因此用一个小电容与按键并联,以 滤去高频杂波;LED 是用来显示按键按下与否,一般商家提供 S3C2410 带有 4 个以上的按键键盘接口,我们只需选用其中的 4 个,导入驱动程序,插入键 盘即可使用。
62

广西大学毕业设计论文

人脸识别系统

图 6-15 键盘电路 以上各个模块的引脚及接口已经给出,只要把各个模块器件按相对应引 脚、接口和 S3C2410 相连,就可以完成系统的硬件设计和组装。

6.4 人脸识别系统的软件设计
软件系统主要是设计上位机向人脸图像处理单元发送控制命令,完成所 需要的操作,如人脸检测、人脸登记、采集并识别人脸、删除用户等,另外 上位机还需要负责液晶显示、键盘扫描等工作。主程序流程图如图 6-15 所 示:

63

广西大学毕业设计论文

人脸识别系统

系统上电初始

是否有单键按下 是



人脸识别键

选择用户键

人脸删除键

人脸采集键



有人脸吗?

发送切换 用户命令


发送采集 对比命令

发送删除 人脸图像命令

有人脸吗?




显示当前用户 及信息 显示下一个 用户及信息 发送采集 人脸命令

是否是 库中

采集成功




显示用户信息


保存图像特征



提示错误

提示错误

图 6-16 人脸系统程序流程图 系统运行所需的软件程序偶可以方在内有 64M 内存的 S3C2410 中,由 S3C2410 发出命令并且执行相关操作。在此前本文已经编写人脸检测和人脸 识别的程序了,这里只要把前面那些程序编成子程序,同时,在加上一些人 机界面和图像解压缩程序,就可以实现人脸识别系统的任务了。

64

广西大学毕业设计论文

人脸识别系统

第七章 总结与展望
人脸识别是一个极富挑战性的问题,尽管目前存在许多的人脸检测和人 脸识别算法 ,但是每种算法都是针对不同的应用环境而得到的 ,还没有一种 算法适用各种不同的环境。虽然人们在人脸识别研究领域中取得了显著的进 展 , 但一个稳定性和鲁棒性强的人脸识别系统需要在不同的环境如光照条 件、人脸方向、姿势和部分遮挡、面部表情以及外部饰物等干扰下,也具有 很好的有效性和稳定性。人脸识别研究的趋势是利用多种线索综合多种分类 方法,启发式信息与统计学习方法相结合。 在本文设计的系统中,采用了基于学习的人脸检测方法和局部特征分析 与最优化匹配的人脸识别算法。采用软件编程程序对静态图像进行人脸检测 和识别时取得较好的识别率,但是由于实验仪器缺乏的原因,所有实验都是 采用静态图像完成的。因此,在复杂的背景和动态的图像等条件下,似乎本 系统是否能达到在实验的效果仍然是个充满疑虑的未知数,同时,在人流量 较大的环境下,本系统又有了明显的挑战,那就是人脸数据库是否能满足要 求,包括实时性的要求。 展望未来,令我们欣喜的是,当前生物认证技术已经再去全球范围内掀 起研究的高潮,越来越多的国家、企业、科研机构、大学投入这场科技大潮 中,这将意味着更新的技术,功能更强大的半导体数据采集系统、性能更好 的计算机将会出现去满足生物认证技术的需要,包括优点突出的人脸识别系 统的要求。而国际互联网的高速发展将为提供更完备的网络人脸数据库,并 将发挥重要的作用。总之,人脸识别系统的明天更好,更美丽。

65

广西大学毕业设计论文

人脸识别系统

参考文献
[1]杨洪艳,韩其睿,人脸识别方法,仪器仪表用户.2007.6 [2]失名.传统识别技术与生物识别技术的比较.防伪技术.2007.11 [3]田捷,杨鑫, 《生物特征识别技术与应用》 ,电子工业出版社,2005.9 [4]庄钊文,黎湘等编著, 《自动目标识别效果评估技术》 ,国家工业出版 社,2006,10 [5]John D.woodward.Jr 等著, 《生物认证》 ,清华大学出版社,2004,2 [6]张成海,张铎主编, 《现代自动识别技术与应用》 ,清华大学出版社, 2003,9 [7]苏剑波,徐波编著, 《应用模式识别技术导论——人脸识别与语音识 别》 ,上海交通大学出版社,2004,1 [8]张忠波,复杂背景下的人脸的检测和识别,博士学位论文,吉林大学 [9] 苏彦华等编著: 《Visual C++数字图像识别技术典型案例》 , 人民邮电 出版社,2004.8 [10] Akamatsu: The IEEE Third International Conference on Automatic Face and Gesture Recognition ,Nara, Japan, April 14-16, 1998 [11] Ying Dai, Yasuaki Nakano: Recognition of facial images with low resolution using ahopfield memory model. Pattern Recognition 31(2): 159-167 ,1998 [12] 边肇祺,张学工等编著: 《模式识别》 ,清华大学出版社,2000.1 [13] 钟珞、潘昊等编: 《模式识别》 ,武汉大学出版社,2006.9 [14] L. Stringa. Automatic Face Recognition Using Directional Derivatives. Tech. Rep.9205-04, IRST, 1991. [15]R.Brunelli,T.Poggio,FaceRecognition Features,Proceedings of ECCV,PP.792-800,1992 [16] N. Intrator, D. Reisfeld, Y. Yeshurun, Extraction of Facial Features for RecognitionUsing Neural Networks, Proceedings of International Workshop on Automatic Face andGesture Recognition, pp. 260-265,1995 [17] G. Yang, T. S. Huang. Human Face Detection in Complex Background.PatternRecognition,27(1):53-63,1994
66

Through

Geometrical

广西大学毕业设计论文

人脸识别系统

[18]三星科技, 《ARM9 应用实例》 ,电子工业出版社 2008,1 [19]丁峰,徐靖,鲁立编著,《ARM 系统开发从实践到提高》 ,中国电力 出版社,2003,7 [20] 苏日建,黄布毅,李银华, 《基于 S3C2410 的嵌入式远程实时图像 采集系统设计》 , 郑 州 轻 工 业 学 院 学 报 ( 自 然 科 学 版 ) , 2006, 5 [21]朱振涛,王成儒,催冬, 《S3C2410 与 TFT—LCD 接口设计》 ,电子 测量技术,2006,10 [22] 阳旭东,马旭东,《基于 S 3 C 2 4 1 0 的远程抄表系集中器的设计与 实现》 ,中国仪器仪表,2006 月 11 月 [23] 王 鑫, 陈晓竹, 徐 倩,《U S B 接口的嵌入式图像采集与显示系 统》 ,中国计量学院学报,2006,3 [24] 郑 坚 平 , 尤 婉 英 . 标 准 正 面 人 脸 图 像 识 别 . 计 算 机 工 程 . 1992,18(1):1-6

67

广西大学毕业设计论文

人脸识别系统

致 谢
首先我要衷心感谢我的导师海涛老师,从 2007 年 4 月参加广西区“挑 战杯”竞赛到现在的毕业设计,无不凝结着海老师的指导、帮助、鼓励,海 老师治学严谨,科研钻研精神尤佳,睿智卓越,在学业上他对我严格要求谆 谆教导,在生活上他慈祥如父和蔼可亲、对我无微不至的关怀、照顾。老师 他那敏锐的观察力和对问题的独到见解令我深深的折服且使我受益匪浅。在 做毕业设计期间,海老师不仅为我们提供了一流的实验条件,并不时地培养 我们通过动手实验来分析解决问题的能力。对我的构思以及论文的内容不厌 其烦的进行悉心指点,即使在他繁忙的工作中仍给予我关心和支持,使我在 完成论文的同时也深受启发和教育。感谢海老师对我的宽容和鼓励,使我能 在遭遇重重困难后依然前行,顺利完成我的学业。 在这里还要真诚地感谢毕耀斌师兄,在设计过程中,经常同毕耀斌师兄 探讨一些在毕业设计过程中遇到的问题,得到了师兄的热情帮助和支持,使 我很多问题能够及时顺利地得以解决。 再次由衷感谢答辩组的各位老师对学生的指导和教诲,我也在努力的积 蓄着力量,我会加倍努力,百尺竿头更进一步。不辜负老师的培养和亲人的 厚望尽自己的微薄之力回报母校的培育之情,争取使自己的人生对社会产生 许多积极的价值!

68

广西大学毕业设计论文

人脸识别系统

附录一:人脸检测主程序 // FaceDetect.cpp : Defines the class behaviors for the application. // #include "stdafx.h" #include "FaceDetect.h" #include "FaceDetectDlg.h" #ifdef _DEBUG #define new DEBUG_NEW #undef THIS_FILE static char THIS_FILE[] = __FILE__; #endif ///////////////////////////////////////////////////////////////////////////// // CFaceDetectApp BEGIN_MESSAGE_MAP(CFaceDetectApp, CWinApp) //{{AFX_MSG_MAP(CFaceDetectApp) // NOTE - the ClassWizard will add and remove mapping macros here. // code! //}}AFX_MSG ON_COMMAND(ID_HELP, CWinApp::OnHelp) END_MESSAGE_MAP() ///////////////////////////////////////////////////////////////////////////// // CFaceDetectApp construction CFaceDetectApp::CFaceDetectApp() { // TODO: add construction code here, // Place all significant initialization in InitInstance } ///////////////////////////////////////////////////////////////////////////// // The one and only CFaceDetectApp object
69

DO NOT EDIT what you see in these blocks of generated

广西大学毕业设计论文

人脸识别系统

CFaceDetectApp theApp; ///////////////////////////////////////////////////////////////////////////// // CFaceDetectApp initialization BOOL CFaceDetectApp::InitInstance() { AfxEnableControlContainer(); // Standard initialization // If you are not using these features and wish to reduce the size // // of your final executable, you should remove from the following the specific initialization routines you do not need. // Call this when using MFC in a shared

#ifdef _AFXDLL Enable3dControls(); DLL #else Enable3dControlsStatic(); // Call this when linking to MFC statically #endif CFaceDetectDlg dlg; m_pMainWnd = &dlg; int nResponse = dlg.DoModal(); if (nResponse == IDOK) { // TODO: Place code here to handle when the dialog is // } else if (nResponse == IDCANCEL) { // TODO: Place code here to handle when the dialog is // } // Since the dialog has been closed, return FALSE so that we exit the // application, rather than start the application's message pump.
70

dismissed with OK

dismissed with Cancel

广西大学毕业设计论文

人脸识别系统

return FALSE; } 附录二:人脸识别主程序
clear; EACHNUM = 4; TT = 200; CLASSNUM = 10; fp = fopen('result.txt','w'); CLASSRATE = zeros(58,50,TT); PseudoLoss = zeros(1,TT); for CLASSNUM = 30:2:30 ALLNUM = CLASSNUM * EACHNUM; for DIMNUM = 50:50 for i=1:CLASSNUM s{i}=strcat('s',int2str(i)); end trainface=[]; for i=1:CLASSNUM loadface=loadimages(strcat('D:\code\100\',s{i},'\'), '', 'bmp'); trainface=[trainface loadface]; train_label((i-1)*EACHNUM+1:i*EACHNUM)=i; end testface=[]; for i=1:CLASSNUM testface=[testface loadimages(strcat('D:\code\100\',s{i},'\'), '', 'bmp')]; test_label((i-1)*EACHNUM+1:i*EACHNUM)=i; end MASK = ones(size(trainface{1})); index = find(MASK); trainX = zeros(size(index,1),size(trainface,2)); for i = 1:ALLNUM trainX(:,i) = trainface{i}(index)./256; end testX=zeros(size(index,1),size(testface,2)); for i=1:size(testface,2), testX(:,i)=testface{i}(index)./256; end clear trainface testface;
71

广西大学毕业设计论文

人脸识别系统

trainY = PCA(trainX,trainX,DIMNUM); testY = PCA(testX,trainX,DIMNUM); clear trianX testX; yResult = zeros(1,ALLNUM); DD = ones(TT,ALLNUM); %?ù ± ???· ?? ? HH = zeros(ALLNUM,CLASSNUM,TT); %?á ? ? HHH = zeros(TT,CLASSNUM,ALLNUM); QQ = zeros(ALLNUM,CLASSNUM,TT); WW = zeros(ALLNUM,CLASSNUM,TT); %?¨ ?? result_label = zeros(1,ALLNUM); W = zeros(TT,ALLNUM); DD(1,:) = 1/ALLNUM; for temp =1:ALLNUM WW(temp,:,1) = DD(1,temp)/(CLASSNUM -1); WW(temp,train_label(temp),1) = 0; end for t = 1:TT %boosting??? ? ?? W(t,:) = sum(WW(:,:,t),2)'; for temp = 1:ALLNUM QQ(temp,:,t) = WW(temp,:,t)./W(t,temp); end DD(t,:) = W(t,:)./sum(W(t,:)); nRightCount = 0; for temp = 1:ALLNUM yClass = prm_distribution(trainY(:,temp),trainY,train_label,DD(t,:),CLASSNUM,EACHNUM); HH(temp,yClass,t) = 1; if yClass == train_label(temp) nRightCount = nRightCount + 1; end end TrainError(t) = (ALLNUM-nRightCount)/ALLNUM; for test = 1:ALLNUM testYY = testY(:,test); yClass = prm_distribution(testYY,trainY,train_label,DD(t,:),CLASSNUM,EACHNUM); HHH(t,yClass,test) = 1; end pseudo_loss = 0; %%%%%%%%%%%%%%%%%%%%%%%%%%%%
72

广西大学毕业设计论文

人脸识别系统

for temp = 1:ALLNUM incorrect_total = sum(QQ(temp,:,t).* HH(temp,:,t)); pseudo_inc = DD(t,temp) * (1- HH(temp,train_label(temp),t) + incorrect_total); pseudo_loss = pseudo_loss + pseudo_inc; end if pseudo_loss == 0 TT = t-1; break; end pseudo_loss = pseudo_loss/2; PseudoLoss(t) = pseudo_loss; bt = pseudo_loss/(1-pseudo_loss); for temp = 1:ALLNUM for tmp = 1:CLASSNUM temp_power = (1+ HH(temp,train_label(temp),t) end end for test = 1:ALLNUM HHH(t,:,test) = HHH(t,:,test).*log(1/bt); end fprintf(1,'CLASSNUM = %d,t=%d,nRightCount=%d,pseudo_loss=%d,bt = %d\n',CLASSNUM,t,nRightCount,pseudo_loss,bt); fprintf(fp,'CLASSNUM = %d,t=%d,nRightCount=%d,pseudo_loss=%d,bt = %d\n',CLASSNUM,t,nRightCount,pseudo_loss,bt); end for t = 1:TT for test = 1:ALLNUM hfx = zeros(1,CLASSNUM); hfx = sum(HHH(1:t,:,test),1); [yValue,yClass] = max(hfx); yResult(1,test) = yClass; end nRightCount = 0; for i = 1:ALLNUM if test_label(i) == yResult(1,i) nRightCount = nRightCount + 1; end end
73

- HH(temp,tmp,t) )/2;

WW(temp,tmp,t+1) = WW(temp,tmp,t) * (bt.^temp_power);

广西大学毕业设计论文

人脸识别系统

CLASSRATE(CLASSNUM,DIMNUM,t) = nRightCount/ALLNUM; fprintf(1,'t=%d,DIM= %d,RightCount=%d,RightRatio=%d\n',t,DIMNUM,nRightCount,CLASSR ATE(CLASSNUM,DIMNUM,t)); fprintf(fp,'t=%d,DIM= %d,RightCount=%d,RightRatio=%d\n',t,DIMNUM,nRightCount,CLASS RATE(CLASSNUM,DIMNUM,t)); end end end save('m2_cr.mat','CLASSRATE'); fclose(fp); %DIMNUM

74


相关文章:
人脸识别系统的实现_图文
随着人们 应用需求的不断深入,人脸识别技术将呈现出主流化、芯片化、标准化发展趋势。人 脸识别系统主要由检测与定位、特征提取与识别两部分组成,在这两部分的基础...
人脸识别系统快速操作手册V2.0
人脸识别系统快速操作手册V2.0_计算机硬件及网络_IT/计算机_专业资料 暂无评价|0人阅读|0次下载|举报文档 人脸识别系统快速操作手册V2.0_计算机硬件及网络_IT/...
人脸识别系统
人脸识别系统_电脑基础知识_IT/计算机_专业资料。基于图形矢量的精准 人脸识别系统 Zhengya Xu, Hong Ren Wu, Xinghuo Yu, Fellow, IEEE, Kathryn Horadam, and...
科技智能人脸识别系统
科技智能人脸识别系统一、 研发背景 经济的快速发展,带来人员在不同地域之间频繁的流动,每年刑 事案件和治安案件逐年上升,众多涉案人员潜逃未能归案,严重损害 了...
人脸识别系统功能简介
XXX 人脸识别系统一、XXX 人脸识别系统简介 XXX 人脸识别系统采用区域特征分析算法,融合计算机图像处 理技术与生物统计学原理于一体,利用计算机图像处理技术从视频 中...
人脸识别系统报告
北京科瑞奇技术开发股份有限公司在 2002 年开发了一种人脸鉴别系统,对人 脸图像进行处理,消除了照相机的影响,再对图像进行特征提取和识别。这对于人脸鉴别特别 有...
基于嵌入式的人脸识别系统
基于嵌入式的人脸识别系统_工学_高等教育_教育专区。嵌入式报告 基于嵌入式的人脸识别系统摘要: 本文阐述了一套基于嵌入式的人脸识别系统设计方案。该系统采用 S3C...
智能人脸识别系统主要应用
云电云安智能人脸识别系统主要应用智能人脸识别系统 云电云安智能人脸识别系统主要应用在重点监管场所的出入口,如机场、火车站、高铁、 海关等,采用自主研发的先进的...
人脸识别系统文档
3 计 014 班 张薇 广西工学院计算机工程系 2005 届毕业论文 人脸识别系统的研究与实现 视频输入踪 跟脸检测和 人部特征定 面人脸识别 身份 情 情感 位性别 ...
人脸识别软件指标
人脸识别软件指标_计算机软件及应用_IT/计算机_专业资料。项目 库容量 2000 万人像 技术要求 1、支持 JPEG、BMP、TIF、JPEG2000 等主流格式。 2、人像相片正面两眼...
更多相关标签: