实验报告课程名称人工智能实验名称人脸识别姓名张文江学号201107010122专业班级计科1201成绩指导教师程国建一、实验目的1、学会使用PCA主成分分析法
2、初步了解人脸识别的特征法
3、更熟练地掌握matlab的使用
二、原理介绍1、PCA(主成分分析法介绍)引用一个网上的例子
假设有一份对遥控直升机操作员的调查,用表示飞行员i的飞行技能,表示飞行员i喜欢飞行的程度
通常遥控直升飞机是很难操作的,只有那些非常坚持而且真正喜欢驾驶的人才能熟练操作
所以这两个属性和相关性是非常强的
我们可以假设两者的关系是按正比关系变化的
如下图里的任意找的向量u1所示,数据散布在u1两侧,有少许噪声
现在我们有两项数据,是二维的
那么如何将这两项变量转变为一个来描述飞行员呢
由图中的点的分布可知,如果我们找到一个方向的U,所有的数据点在U的方向上的投影之和最大,那么该U就能表示数据的大致走向
而在垂直于U的方向,各个数据点在该方向的投影相对于在U上的投影如果足够小,那么我们可以忽略掉各数据在该方向的投影,这样我们就把二维的数据转化成了在U方向上的一维数据
为了将u选出来,我们先对数据进行预处理
先求出所有数据的平均值,然后用数据与平均值的偏差代替数据本身
然后对数据归一化以后,再代替数据本身
而我们求最大的投影和,其实就是求各个数据点在U上的投影距离的方差最大
而XTu就是投影的距离
故我们要求下式的最大值:按照u是单位向量来最大化上式,就是求的特征向量
而此式是数据集的协方差矩阵
在实际应用中,我们不止面临二维的数据
因此不能使用几何的形式呈现,但原理也是一样
就是找到一组相互正交的单位向量,然后根据贡献率考虑选择其中的部分作为考量的维数,这也就实现了数据的降维
三、实验步骤1、将库里的400张照片分成两组
一组作为训练,一组作为库
每个人的前五张照片作为训练,后五张作为库