文档名:基于SIFT的说话人唇动识别 
针对唇部特征提取维度过高以及时尺度空间敏感的问题,提出了一种基于尺度不变特征变换(SIFT)算法作特征提取来进行说话人身份认证的技术.首先,提出了一种简单的视频帧图片规整算法,将不同长度的唇动视频规整到同一的长度,提取出具有代表性的唇动图片;然后,提出一种在SIFT关键点的基础上,进行纹理和运动特征的提取算法,并经过主成分分析(PCA)算法的整合,最终得到具有代表性的唇动特征进行认证;最后,根据所得到的特征,提出了一种简单的分类算法.实验结果显示,和常见的局部二元模式(LBP)特征和方向梯度直方图(HOG)特征相比较,该特征提取算法的错误接受率(FAR)和错误拒绝率(FRR)表现更佳.说明整个说话人唇动特征识别算法是有效的,能够得到较为理想的结果. 
作者:马新军吴晨晨仲乾元李园园 
作者单位:哈尔滨工业大学(深圳)机电工程与自动化学院,广东深圳518055 
母体文献:第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议(CRSSC-CWI-CGrC-3WD2017)论文集 
会议名称:第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议(CRSSC-CWI-CGrC-3WD2017)   
会议时间:2017年5月26日 
会议地点:合肥 
主办单位:中国计算机学会,中国人工智能学会 
语种:chi 
分类号: 
关键词:唇部图片  图像识别  特征提取  分类算法 
在线出版日期:2018年7月24日 
基金项目: 
相似文献 
相关博文 
- 文件大小:
 
- 1.29 MB
 
 
- 下载次数:
 
- 60
 
 
 
- 
		
高速下载
 
 
 
 |   
		
		
 	
  
 |