文档摘要:针对实时语音识别中存在的问题,提出基于长短期记忆(LongShort-TermMemory,LSTM)的语音字幕转换技术.首先介绍网络直播实时字幕生成的总体框架,其次详细阐述LSTM在语音字幕转换中的应用,最后选用Librispeech数据集进行实验.实验结果表明,基于LSTM的语音字幕转换技术在处理多样化的音频数据时具有较高的适应性. 
 
Abstract:Aimingattheproblemsinreal-timespeechrecognition,aspeechsubtitleconversiontechnologybasedonLongShort-TermMemory(LSTM)isproposed.Firstly,theoverallframeworkofreal-timesubtitlegenerationforonlinelivestreamingisintroduced.Secondly,theapplicationofLSTMinvoicesubtitleconversioniselaboratedindetail.Finally,theLibrispeechdatasetisusedforexperiments.TheexperimentalresultsshowthatLSTMbasedspeechsubtitleconversiontechnologyhashighadaptabilityinprocessingdiverseaudiodata. 
 
作者:刘俊丽Author:LIUJunli 
作者单位:襄汾县融媒体中心,山西临汾041500 
刊名:电声技术  
Journal:AudioEngineering 
年,卷(期):2024, 48(6) 
分类号:TN912.3 
关键词:语音识别  字幕生成  长短期记忆(LSTM)  网络直播   
Keywords:speechrecognition  subtitlegeneration  LongShort-TermMemory(LSTM)  onlinelivestreaming   
机标分类号:TP391.42TN912.34F270.7 
在线出版日期:2024年7月10日 
基金项目:基于LSTM的语音字幕转换技术[ 
期刊论文]  电声技术--2024, 48(6)刘俊丽针对实时语音识别中存在的问题,提出基于长短期记忆(LongShort-TermMemory,LSTM)的语音字幕转换技术.首先介绍网络直播实时字幕生成的总体框架,其次详细阐述LSTM在语音字幕转换中的应用,最后选用Librispeech数据集进行...参考文献和引证文献 
参考文献 
引证文献 
本文读者也读过 
相似文献 
相关博文 
 
关键词:语音识别,字幕生成,长短期记忆(LSTM),网络直播, 
 
- 文件大小:
 
- 1.61 MB
 
 
- 下载次数:
 
- 60
 
 
 
- 
		
高速下载
 
 
 
 |   
		
		
 	
  
 |