Robert Lorenz(德国籍),澎思科技资深算法研究员,德国柏林洪堡大学数学系博士,致力于人脸检测、人脸跟踪和人脸质量判断等领域的技术研发,尤其擅长模型构建和模型优化。其研究成果已经应用于澎思科技多种人脸识别软件平台和硬件产品中。同时也致力于视频结构化算法的研究和开发,负责数个子研究课题的攻坚工作。
曾任职学习宝联合创始人兼首席科学家、精通5国语言,完成学习宝所有模式识别算法的搭建及商用。精通模式识别、机器学习与图像处理的常见算法,例如贝叶斯分类器、SVM、ADA-BOOST、MLP、CNN、kernelized回归、受限制BOLTZMANN机、特征提取、特征选择,图像预处理、二值化算法、连通域分析、PPC(Project Profile Cutting),Viterbi算法,C语言数据结构,例如树结构、图形结构等等。
在 9 月 5 日的 AI 研习社职播间频道中,Robert Lorenz为我们带来了相关的分享,以下是本期职播间的简要回顾,具体回顾视频,请点击文末【阅读原文】观看。
回顾正文
大家好,我是来自德国的Robert,目前在澎思科技负责算法研究、算法设计和算法实现,今天想分享的内容是有限算力资源下的深度学习与人脸识别技术——人脸抓拍设计、移植和优化。在标题中大家可以看到两个关键词,第一深度学习,第二人脸识别。
人脸识别主要分两大类,第一人脸抓拍,指的是从原始的数据(如录像数据)中提取人脸,第二大类是对提取好的人脸进行进一步操作,比如人脸比对、人脸性别分类、表情分类等具体应用。今天我们把重点放在人脸抓拍这一步,还会特别注意算法的运行速度。
近年来,所有的人脸识别算法都是基于深度学习完成的,所以今天分享的内容也基于深度学习来展开,具体目录如下:
1.深度学习定义与概念
大家可能听过深度学习这个术语,但是深度学习到底是什么?如图所示,即为深度学习的定义。我们将深度学习之外所有的模式识别算法命名为传统模式识别算法。下面来了解一下深度学习和传统模式识别之间有哪些区别,深度学习的特点是什么。
传统算法主要有两个步骤。其中第一步为“手动特征提取”,即按照当前分类任务手动定义特征提取方法。下图显示对于文字图像的边缘特征,总共四个方向的边缘特征。深度学习之前,基于四个方向的边缘特征在文字识别领域非常流行,因为文字图像边缘特征的判别能力好于原始图像像素的判别能力。
传统算法第二步为“训练参数”,参数训练是基于在第一步提取好的特征进行的。下图显示对于文字特征向量的建模,每类由多维高斯分布建模。多维高斯分布唯一由期望值和相关矩阵描述。为了提高鲁棒性,仅仅估计了相关矩阵的前k个特征值和特征向量,后(d-k)个特征值由一个常数描述。有了每一类的参数,可以使用贝叶斯分类器对未知、不在训练库的新图像提取特征,并对提取好的特征进行分类。
传统方法有一些不太理想的地方:特征提取和参数训练的两个步骤是拆开的。更优的方案是联合优化特征提取和参数训练。另外,预测任务的变化引起特征提取方法的改动。例如,对肿瘤检测文理特征判别能力好于边缘特征。为了达到不错的预测效果,每个领域需要有经验的专家琢磨出好的手动特征提取方法。深度学习克服了这些难题。
接下来我们看一下,深度学习放弃手动特征提取而采用自动特征提取,如图所示:
上图有10个特征层,每一层的参数是自动学习的,不涉及到手动干预。因深度学习的特征提取是自动、智能的,所以深度学习属于人工智能的领域。
转载请注明出处。