文档名:面向神经机器翻译的集成学习方法分析
集成学习是一种联合多个学习器进行协同决策的机器学习方法,应用在机器翻译任务的推断过程中可以有效整合多个模型预测的概率分布,达到提升翻译系统的准确性的目的.虽然该方法有效性已在机器翻译评测得到了广泛验证,但关于子模型的选择与融合的策略仍鲜有研究.该文主要针对机器翻译任务中的参数平均与模型融合两种集成学习方法进行了大量的实验,分别从模型与数据层面、多样性与模型数量层面对集成学习的策略进行了深入探索.最终实验结果在WMT中英新闻任务上,相比Transformer单模型有3.2个BLEU值的提升.
作者:李北王强姜雨帆张哲旸刘继强张俐肖桐
作者单位:东北大学自然语言处理实验室,辽宁沈阳110819
母体文献:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)论文集
会议名称:第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会(CCL2018)
会议时间:2018年10月19日
会议地点:长沙
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:神经机器翻译 集成学习 参数平均 模型融合
在线出版日期:2021年9月13日
基金项目:
相似文献
相关博文
- 文件大小:
- 991.81 KB
- 下载次数:
- 60
-
高速下载
|
|