返回列表 发布新帖

基于LSTM的语音字幕转换技术

15 0
1 黄金阳光 发表于 2024-10-4 00:25 | 查看全部 阅读模式
文档摘要:针对实时语音识别中存在的问题,提出基于长短期记忆(LongShort-TermMemory,LSTM)的语音字幕转换技术.首先介绍网络直播实时字幕生成的总体框架,其次详细阐述LSTM在语音字幕转换中的应用,最后选用Librispeech数据集进行实验.实验结果表明,基于LSTM的语音字幕转换技术在处理多样化的音频数据时具有较高的适应性.

Abstract:Aimingattheproblemsinreal-timespeechrecognition,aspeechsubtitleconversiontechnologybasedonLongShort-TermMemory(LSTM)isproposed.Firstly,theoverallframeworkofreal-timesubtitlegenerationforonlinelivestreamingisintroduced.Secondly,theapplicationofLSTMinvoicesubtitleconversioniselaboratedindetail.Finally,theLibrispeechdatasetisusedforexperiments.TheexperimentalresultsshowthatLSTMbasedspeechsubtitleconversiontechnologyhashighadaptabilityinprocessingdiverseaudiodata.

作者:刘俊丽Author:LIUJunli
作者单位:襄汾县融媒体中心,山西临汾041500
刊名:电声技术
Journal:AudioEngineering
年,卷(期):2024, 48(6)
分类号:TN912.3
关键词:语音识别  字幕生成  长短期记忆(LSTM)  网络直播  
Keywords:speechrecognition  subtitlegeneration  LongShort-TermMemory(LSTM)  onlinelivestreaming  
机标分类号:TP391.42TN912.34F270.7
在线出版日期:2024年7月10日
基金项目:基于LSTM的语音字幕转换技术[
期刊论文]  电声技术--2024, 48(6)刘俊丽针对实时语音识别中存在的问题,提出基于长短期记忆(LongShort-TermMemory,LSTM)的语音字幕转换技术.首先介绍网络直播实时字幕生成的总体框架,其次详细阐述LSTM在语音字幕转换中的应用,最后选用Librispeech数据集进行...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文

关键词:语音识别,字幕生成,长短期记忆(LSTM),网络直播,

2024-10-4 00:25 上传
文件大小:
1.61 MB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表