文档名:一种基于降维超矢量的说话人确认方法
本文使用TIMIT语料库通过最大期望算法训练得到512阶的通用背景模型,以MIT语料库为主实验库,通过贝叶斯学习算法从通用背景模型中自适应训练得到MIT两个信道下全部注册者的模型.接着将模板中个人高斯混合模型的均值空间映射到超矢量空间,对注册库中96个均值超矢量进行主成分降维分析后,观察发现性别影响大于信道影响,且降维后的数据在非线性回归分类器中具有最佳的分类效果.实验一中采用经典的UBM-MAP-GMM模型和似然比得分,分别对基于全局UBM和性别相关UBM系统的等错误率进行了分析;实验结果显示,在语音时长为25s时,系统等错误率由13.59%下降至11.72%.实验二中采用基于降维均值超矢量和余弦得分的系统,该系统提取类似于i-vector的低维均值超矢量作为身份矢量;实验结果显示,6144维均值超矢量能较好地表征说话人,系统等错误率进一步降至10.22%.
作者:何建超章坚武吴震东
作者单位:杭州电子科技大学通信工程学院,杭州310018
母体文献:浙江省信号处理学会2015学术年会论文集
会议名称:浙江省信号处理学会2015学术年会
会议时间:2015年12月1日
会议地点:杭州
主办单位:浙江省信号处理学会
语种:chi
分类号:TP3S15
关键词:语音识别 说话人确认 均值超矢量 等错误率
在线出版日期:2018年11月21日
基金项目:
相似文献
相关博文
- 文件大小:
- 1.52 MB
- 下载次数:
- 60
-
高速下载
|