基于RePerceptronCRF的规范类文本分词研究
文档名:基于RePerceptronCRF的规范类文本分词研究
摘要:通过Re-Perceptron-CRF组合方法,利用规范类文档特点,对关键词进行切分.分别采取Viterbi、Percep-tron、CRF和Re-Perceptron-CRF4种算法分别对规范类文本进行分词研究.具体为基于句法分析对规范类文本使用正则表达式进行标准化处理,得到适合分析的预处理文本,并通过Perceptron与CRF的双重算法返回各自的最优结果.实验表明,Re-Perceptron-CRF算法明显提高分词效果,在准确率和召回率上均有良好表现,其准确率和召回率分别达到94.36%和97.02%.该方法为规范类文本中文分词相关工作提供一定的研究思路,为后续应用提供好的数据支撑.但由于数据量较小,该方法仅适用于特定领域,如建筑检测领域.
作者:李宝林刘宇韬Author:LIBaolinLIUYutao
作者单位:成都信息工程大学物流学院,四川成都610103
刊名:成都信息工程大学学报
Journal:JournalofChengduUniversityOfInformationTechnology
年,卷(期):2023, 38(3)
分类号:TP391.1
关键词:管理科学与工程文本分析中文分词Re-Perceptron-CRF词性标注
机标分类号:TP391.1TN912.3H178
在线出版日期:2023年6月6日
基金项目:四川省科技服务业示范资助项目,四川省电子商务与现代物流研究中心重点资助项目基于Re-Perceptron-CRF的规范类文本分词研究[
期刊论文]成都信息工程大学学报--2023, 38(3)李宝林刘宇韬通过Re-Perceptron-CRF组合方法,利用规范类文档特点,对关键词进行切分.分别采取Viterbi、Percep-tron、CRF和Re-Perceptron-CRF4种算法分别对规范类文本进行分词研究.具体为基于句法分析对规范类文本使用正则表达式进行...参考文献和引证文献
参考文献
引证文献
本文读者也读过
相似文献
相关博文
基于Re-Perceptron-CRF的规范类文本分词研究Research on Word Segmentation of Normative Text based on Re-Perceptron-CRF
基于Re-Perceptron-CRF的规范类文本分词研究.pdf
页:
[1]