文档名:一种语义驱动的司法文档学习分类方法
随着全国司法机关智能化建设和信息化建设应用的深入推进,积累了海量的司法文书,这为开展司法大数据应用和司法智能服务提供了基础.通过司法文书的相似性分析,实现类案推送,为司法人员提供智能辅助办案服务,可以显著提高办案的质量和效率.本文提出了一种语义驱动的方法来学习和分类司法文书.首先提出并构建了面向司法领域的领域知识本体以清晰表达文档级语义,然后在领域本体基础之上对司法文档进行相应的领域知识抽取.接着利用图长短期记忆模型(GraphLSTM)对司法文书进行训练和分类.最后,通过实验验证了该方法的有效性,实验结果表明该方法要显著优于一些常用的机器学习方法(如LSTM和SVM).
作者:马建刚 马应龙
作者单位:中国人民大学法学院,北京100872;国家检察官学院,北京102206;河南省人民检察院,郑州450004华北电力大学控制与计算机工程学院,北京102206
母体文献:第六届中国计算机学会大数据学术会议论文集
会议名称:第六届中国计算机学会大数据学术会议
会议时间:2018年10月11日
会议地点:西安
主办单位:中国计算机学会
语种:chi
分类号:
关键词:司法文书 领域知识 长短期记忆模型 办案效率
在线出版日期:2020年11月30日
基金项目:
相似文献
相关博文
- 文件大小:
- 417.05 KB
- 下载次数:
- 60
-
高速下载
|