文档摘要:针对实时语音识别中存在的问题,提出基于长短期记忆(LongShort-TermMemory,LSTM)的语音字幕转换技术.首先介绍网络直播实时字幕生成的总体框架,其次详细阐述LSTM在语音字幕转换中的应用,最后选用Librispeech数据集进行实验.实验结果表明,基于LSTM的语音字幕转换技术在处理多样化的音频数据时具有较高的适应性.
Abstract:Aimingattheproblemsinreal-timespeechrecognition,aspeechsubtitleconversiontechnologybasedonLongShort-TermMemory(LSTM)isproposed.Firstly,theoverallframeworkofreal-timesubtitlegenerationforonlinelivestreamingisintroduced.Secondly,theapplicationofLSTMinvoicesubtitleconversioniselaboratedindetail.Finally,theLibrispeechdatasetisusedforexperiments.TheexperimentalresultsshowthatLSTMbasedspeechsubtitleconversiontechnologyhashighadaptabilityinprocessingdiverseaudiodata.
作者:刘俊丽Author:LIUJunli
作者单位:襄汾县融媒体中心,山西临汾041500
刊名:电声技术
Journal:AudioEngineering
年,卷(期):2024, 48(6)
分类号:TN912.3
关键词:语音识别 字幕生成 长短期记忆(LSTM) 网络直播
Keywords:speechrecognition subtitlegeneration LongShort-TermMemory(LSTM) onlinelivestreaming
机标分类号:TP391.42TN912.34F270.7
在线出版日期:2024年7月10日
基金项目:基于LSTM的语音字幕转换技术[
期刊论文] 电声技术--2024, 48(6)刘俊丽针对实时语音识别中存在的问题,提出基于长短期记忆(LongShort-TermMemory,LSTM)的语音字幕转换技术.首先介绍网络直播实时字幕生成的总体框架,其次详细阐述LSTM在语音字幕转换中的应用,最后选用Librispeech数据集进行...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
关键词:语音识别,字幕生成,长短期记忆(LSTM),网络直播,
- 文件大小:
- 1.61 MB
- 下载次数:
- 60
-
高速下载
|
|