文档名:基于非平行语料的双语词典构建
在进行跨语言自然语言处理时,缺少双语资源是非常棘手的问题,而这在语言资源匮乏的场景下是非常普遍的.此时,利用好非平行语料中蕴含的翻译知识变得更为重要.由于语料不平行,从中获取翻译知识意味着小数据、无监督学习,因此极具挑战,而取得的结果通常是双语词典的形式.这既是人工智能领域重要的学术问题,也在语言资源匮乏场景有着巨大的应用价值.本文针对前人研究中存在的问题,介绍一系列工作,从各个角度探索如何更好地利用非平行语料构建双语词典.
作者:张檬刘洋孙茂松
作者单位:清华大学计算机科学与技术系,北京100084;清华大学智能技术与系统国家重点实验室,北京100084;北京信息科学与技术国家研究中心,北京100084
母体文献:人工智能领域青年学者研讨会论文集
会议名称:人工智能领域青年学者研讨会
会议时间:2017年8月4日
会议地点:昆明
主办单位:《中国科学:信息科学》杂志社
语种:chi
分类号:TP3H08
关键词:机器翻译 双语词典 非平行语料 人工智能
在线出版日期:2020年6月28日
基金项目:
相似文献
相关博文
- 文件大小:
- 365.72 KB
- 下载次数:
- 60
-
高速下载
|
|