首页> 中国专利> 蒙古语裁决文书信息自动标注及抽取方法和装置

蒙古语裁决文书信息自动标注及抽取方法和装置

摘要

本发明提供一种从蒙古语判决文书中自动标注并提取关键信息的方法和装置,涉及文本处理技术领域。本发明通过获取蒙古语判决文书原始数据;对蒙古语判决文书原始数据进行预处理;根据预设的属性标签体系对预处理后的蒙古语判决文书原始数据进行关键要素标注,得到标注文书,所述预设的属性标签体系基于汉语判决文书构建;采用正则表达式对标注文书进行信息抽取,得到关键信息。本发明针对直接蒙古语判决文书中难以获取全面的属性标签的情况,采用从大规模的汉语判决文书获取更加全面的属性标签,并以此构建体系。然后通过将构建的体系应用到蒙古语判决文书中,从而实现蒙古语判决文书的自动标注抽取,提高标注效率和准确率。

著录项

  • 公开/公告号CN113435164A

    专利类型发明专利

  • 公开/公告日2021-09-24

    原文格式PDF

  • 申请/专利权人 中央民族大学;

    申请/专利号CN202110532905.3

  • 发明设计人 赵小兵;张亮;

    申请日2021-05-17

  • 分类号G06F40/117(20200101);G06Q50/18(20120101);

  • 代理机构11542 北京久诚知识产权代理事务所(特殊普通合伙);

  • 代理人翟丽红

  • 地址 100081 北京市海淀区中关村南大街27号

  • 入库时间 2023-06-19 12:42:10

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号