代码拉取完成,页面将自动刷新
同步操作将从 大奥特曼打小怪兽/opencv 强制同步,此操作会覆盖自 Fork 仓库以来所做的任何修改,且无法恢复!!!
确定后同步将在后台操作,完成时将刷新页面,请耐心等待。
# -*- coding: utf-8 -*-
"""
Created on Fri Aug 17 17:53:30 2018
@author: lenovo
"""
'''
自己实现一个人脸识别
'''
'''
人脸识别经典算法实现(一)——特征脸法:https://blog.csdn.net/freedom098/article/details/52088064
第一种比较经典的算法就是特征脸法,本质上其实就是PCA降维,这种算法的基本思路是,把二维的图像先灰度化,
转化为一通道的图像,之后再把它首尾相接转化为一个列向量,假设图像大小是20*20的,那么这个向量就是400维
,理论上讲组织成一个向量,就可以应用任何机器学习算法了,但是维度太高算法复杂度也会随之升高,所以需要
使用PCA算法降维,然后使用简单排序或者KNN都可以。
PCA降维:将一组N维向量降到K维,PCA通过寻找K个单位正交基,使得原始数据变换到这组基后各个字段两两间协方差
为0,而字段的方差尽可能大
http://blog.codinglabs.org/articles/pca-tutorial.html
'''
import numpy as np
import cv2
import os
from sklearn import neighbors
def load_images(data):
'''
加载数据集
params:
data:训练集数据所在的目录,要求数据尺寸大小一样
ret:
images:[m,height,width] m为样本数,height为高,width为宽
names:名字的集合
labels:标签
'''
images = []
labels = []
names = []
label = 0
#过滤所有的文件夹
for subDirname in os.listdir(data):
subjectPath = os.path.join(data,subDirname)
if os.path.isdir(subjectPath):
#每一个文件夹下存放着一个人的照片
names.append(subDirname)
for fileName in os.listdir(subjectPath):
imgPath = os.path.join(subjectPath,fileName)
img = cv2.imread(imgPath,cv2.IMREAD_GRAYSCALE)
images.append(img)
labels.append(label)
label += 1
images = np.asarray(images)
labels = np.asarray(labels)
return images,labels,names
class EigenFace(object):
def __init__(self,dimNum=150,n_neighbors=3,dsize=(100,100)):
'''
构造函数:初始化参数
params:
dimNum:PCA降维后的维度k
n_neighbors:knn的参数n_neighbors
dsize:对输入图像进行预处理,指定图像预处理时缩放的尺寸
'''
self.__dimNum = dimNum
self.__dsize = dsize
self.__mean = 0.0
self.__knn = neighbors.KNeighborsClassifier(n_neighbors)
def __pca(self,X):
'''
使用PCA对数据进行降维
params:
X:源数据,形状为[m,n] m为样本数,n为样本的维数
return:
降维后的训练集数据[m,k] 和变换矩阵P = [k,n]
'''
#[n,m]
X = X.T
#均值化矩阵 [n,]
mean = np.reshape(np.mean(X,axis=1),(-1,1))
self.__mean = mean
#去均值 [n,m] - [n,1]
diff = X - mean
'''
求协方差矩阵
这里不去直接去求np.dot(diff,diff.T)的的特征向量和特征值,而是通过求np.dot(diff.T,diff)的特征向量和特征值变换得到
主要是因为np.dot(diff,diff.T)为[n,n]
np.dot(diff.T,diff)为[m,m]
特征数远大于样本数,所以直接对[n,n]矩阵求特征值比较慢
'''
cov = np.dot(diff.T,diff)/diff.shape[1]
'''
计算[m,m]的协方差矩阵的特征值[m,]和特征向量[m,m]
'''
eigVals,eigVects = np.linalg.eig(cov)
#通过左乘diff得到[n,n]矩阵的特征向量[n,m]
eigVects = np.dot(diff,eigVects)
print('特征向量维度:',eigVects.shape)
#对特征值进行排序 返回排序后的索引顺序,从小到大排序
eigValIndex = np.argsort(eigVals)
#从大到小排序
eigValIndex = eigValIndex[::-1]
#取出指定个数的前k大的特征值
eigValIndex = eigValIndex[:self.__dimNum]
#归一化特征向量
eigVects = eigVects/np.linalg.norm(eigVects,axis=0)
#变换矩阵[k,n]
transMat = (eigVects.T)[eigValIndex,:]
#计算经过变换矩阵变换后的新数据 [k,n]x[n,m] = [k,m]
lowMat = np.dot(transMat,diff)
#[m,k]
lowMat = lowMat.T
print('降维后的矩阵lowMat维度为:',lowMat.shape)
return lowMat,transMat
def __prepare(self,images):
'''
对图片进行预处理,统一尺寸,直方图均衡化(防止曝光不均衡)
params:
images:训练集数据,要求为灰度图片 [m,height,width] m为样本数,height为高,width为宽
return:
处理之后的数据 [m,n] n = dsize[0]x dsize[1] 即特征数
'''
new_images = []
for image in images:
#缩放
re_img = cv2.resize(image,self.__dsize)
#直方图均衡化
hist_img = cv2.equalizeHist(re_img)
#转换成一行数据
hist_img = np.reshape(hist_img,-1)
new_images.append(hist_img)
new_images = np.asarray(new_images)
return new_images
def fit(self,X_train,Y_train):
'''
训练,这里使用KNN算法
params:
X_train:训练集数据,要求为灰度图片 [m,height,width] m为样本数,height为高,width为宽
Y_train:训练集标签 [m,]
'''
#对图片数据进行预处理 [M,N]
X_train = self.__prepare(X_train)
#对图片数据进行降维处理 X_train_pca:[m,k] __transMat:[n,k]
X_train_pca,self.__transMat = self.__pca(X_train)
#开始训练
self.__knn.fit(X_train_pca,Y_train)
def predict(self,X_test):
'''
开始预测
params:
X_test:测试图片,要求为灰度图片 [m,hight,width]
return:
Y_pred:[m,1] 返回预测的标签
'''
if len(X_test.shape) == 2:
X_test = np.expand_dims(X_test,axis=0)
#对数据进行预处理 [m,n]
X_test = self.__prepare(X_test)
#计算经过变换矩阵变换后的新数据 [m,k]
X_test_pca = np.dot(self.__transMat,X_test.T-self.__mean)
X_test_pca = X_test_pca.T
Y_pred = self.__knn.predict(X_test_pca)
return Y_pred
if __name__=='__main__':
face = EigenFace(100)
#准备训练集数据
X_train,Y_train,names = load_images('./face')
face.fit(X_train,Y_train)
#创建一个级联分类器 加载一个 .xml 分类器文件. 它既可以是Haar特征也可以是LBP特征的分类器.
face_cascade = cv2.CascadeClassifier('./haarcascades/haarcascade_frontalface_default.xml')
#打开摄像头
camera = cv2.VideoCapture(0)
cv2.namedWindow('Dynamic')
print('开始预测')
while(True):
#读取一帧图像
ret,frame = camera.read()
#判断图片读取成功?
if ret:
gray_img = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
#人脸检测
faces = face_cascade.detectMultiScale(gray_img,1.3,5)
for (x,y,w,h) in faces:
#在原图像上绘制矩形
frame = cv2.rectangle(frame,(x,y),(x+w,y+h),(255,0,0),2)
roi_gray = gray_img[y:y+h,x:x+w]
Y_pred = face.predict(roi_gray)
name = names[Y_pred[0]]
print('Label:%s'%(name))
cv2.putText(frame,name,(x,y-20),cv2.FONT_HERSHEY_SIMPLEX,1,255,2)
cv2.imshow('Dynamic',frame)
#如果按下q键则退出
if cv2.waitKey(100) & 0xff == ord('q') :
break
camera.release()
cv2.destroyAllWindows()
此处可能存在不合适展示的内容,页面不予展示。您可通过相关编辑功能自查并修改。
如您确认内容无涉及 不当用语 / 纯广告导流 / 暴力 / 低俗色情 / 侵权 / 盗版 / 虚假 / 无价值内容或违法国家有关法律法规的内容,可点击提交进行申诉,我们将尽快为您处理。