文档名:深度神经网络的语音深度特征提取方法
为了提升连续语音识别系统性能,将深度自编码器神经网络应用于语音信号特征提取.通过堆叠稀疏自编码器组成深度自编码器(DeepAuto-Encoding,DAE),经过预训练和微调两个步骤提取语音信号的本质特征,使用与上下文相关的三音素模型,以音素错误率大小为系统性能的评判标准.仿真结果表明相对于传统梅尔频率倒谱系数(Mel-FrequencyCepstralCoefficient,MFCC)特征以及优化后的MFCC特征,基于深度自编码器提取的深度特征更具优越性.
作者:李涛曹辉郭乐乐
作者单位:陕西师范大学物理学与信息技术学院,陕西西安710100
母体文献:2018中国西部声学学术交流会论文集
会议名称:2018中国西部声学学术交流会
会议时间:2018年8月23日
会议地点:兰州
主办单位:中国声学学会微声学分会,四川省声学学会,山东声学学会,上海声学学会,黑龙江省声学学会,陕西省声学学会,浙江省声学学会
语种:chi
分类号:
关键词:语音识别 深度自编码器 梅尔频率倒谱系数 特征提取
在线出版日期:2020年7月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 610.7 KB
- 下载次数:
- 60
-
高速下载
|