首页> 外国专利> CHINESE ADDRESS PARSING AND ANNOTATION METHOD

CHINESE ADDRESS PARSING AND ANNOTATION METHOD

机译:中文地址解析和注释方法

摘要

The present invention relates to a Chinese address parsing and annotation method. The present method comprises: step 11, manually parsing and annotating selected address data and using same as training data; step 12, using specified single Arabic numerical characters or English letter characters to replace single Arabic numerical characters or English letter characters and multiple consecutive Arabic numerical characters or English letter characters that appear; step 13, converting training data to a format required by a CRF++ tool; step 14, defining a characteristic template; step 15, establishing a parsing and annotation model; step 16, using the specified single Arabic numerical characters or English letter characters to replace single Arabic numerical characters or English letter characters and multiple consecutive Arabic numerical characters or English letter characters that appear in the address; step 17, using the CRF++ tool for parsing and annotation; step 18, restoring the replaced Arabic numerical characters or English letter characters. The Chinese address parsing and annotation method of the present invention is highly accurate.
机译:本发明涉及中文地址解析和注释方法。本方法包括:步骤11,手动解析并注释选择的地址数据,并将其用作训练数据;步骤12,使用指定的单个阿拉伯数字字符或英文字母字符替换出现的单个阿拉伯数字字符或英文字母字符以及多个连续的阿拉伯数字字符或英文字母字符;步骤13,将训练数据转换为CRF ++工具所需的格式;步骤14,定义特征模板;步骤15,建立解析注释模型;步骤16,使用指定的单个阿拉伯数字字符或英文字母字符替换出现在地址中的单个阿拉伯数字字符或英文字母字符以及多个连续的阿拉伯数字字符或英文字母字符;步骤17,使用CRF ++工具进行解析和注释;步骤18,还原替换的阿拉伯数字字符或英文字母字符。本发明的中文地址解析和注释方法是高度准确的。

著录项

  • 公开/公告号WO2016179987A1

    专利类型

  • 公开/公告日2016-11-17

    原文格式PDF

  • 申请/专利权人 SHENZHEN AUDAQUE DATA TECHNOLOGY LTD.;

    申请/专利号WO2015CN94374

  • 发明设计人 WANG MINGXING;JIA XIBEI;

    申请日2015-11-12

  • 分类号G06F17/27;

  • 国家 WO

  • 入库时间 2022-08-21 13:33:59

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号