返回列表 发布新帖

基于转换表及上下文环境的汉语简繁文本双向翻译

13 0
admin 发表于 2024-12-10 15:54 | 查看全部 阅读模式

文档名:基于转换表及上下文环境的汉语简繁文本双向翻译
现有的简繁转换技术在处理简繁一对多时效果不是很理想.为了解决这一问题,作者提出了基于转换表和上下文的汉语简繁文本双向翻译方法.作者之前的研究工作成果在教育部语信司所举行的简繁一对多转换评测中取得了95.6%的转换准确率.在此研究基础上,本文提出了使用规则加组合统计模型来解决这一问题,所组合的统计模型为SVM、最大熵和Bayes模型.同时作者还提出了一种提高文本分类准确度的新的特征选择方法ADMMR,该方法和ECE,卡方检验这两种特征选择方法具有相当的性能;同时还提出了最大熵模型的特征值使用tf-idf,而不使用0-1值.实验表明这一调整使准确度提高了约2%.此外,作者使用ADMMR、ECE和卡方检验作为文本的特征选择方法,使用tf-idf来量化每一个特征,经过实验表明组合模型在处理一简对多繁问题时具有更高的转换准确率和更稳定的性能.实验表明规则加组合模型的方法能够达到98.5%的准确率,较好地解决了简繁转换中的一对多转换的问题.
作者:庞祯军姚天昉
作者单位:上海交通大学计算机科学与工程系,上海200240
母体文献:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)论文集
会议名称:中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)  
会议时间:2015年11月13日
会议地点:广州
主办单位:中国中文信息学会
语种:chi
分类号:
关键词:汉语文本  简繁转换  特征选择  转换准确率
在线出版日期:2018年3月21日
基金项目:
相似文献
相关博文
2024-12-10 15:54 上传
文件大小:
600.75 KB
下载次数:
60
高速下载
【温馨提示】 您好!以下是下载说明,请您仔细阅读:
1、推荐使用360安全浏览器访问本站,选择您所需的PDF文档,点击页面下方“本地下载”按钮。
2、耐心等待两秒钟,系统将自动开始下载,本站文件均为高速下载。
3、下载完成后,请查看您浏览器的下载文件夹,找到对应的PDF文件。
4、使用PDF阅读器打开文档,开始阅读学习。
5、使用过程中遇到问题,请联系QQ客服。

本站提供的所有PDF文档、软件、资料等均为网友上传或网络收集,仅供学习和研究使用,不得用于任何商业用途。
本站尊重知识产权,若本站内容侵犯了您的权益,请及时通知我们,我们将尽快予以删除。
  • 手机访问
    微信扫一扫
  • 联系QQ客服
    QQ扫一扫
2022-2025 新资汇 - 参考资料免费下载网站 最近更新浙ICP备2024084428号
关灯 返回顶部
快速回复 返回顶部 返回列表