首页> 中国专利> 文本特征值的提取方法、装置及电子设备

文本特征值的提取方法、装置及电子设备

摘要

本发明实施例提供的一种文本特征值的提取方法、装置及电子设备。通过将待提取特征值的文本中的字符转换为对应的编码,得到编码序列,按照编码序列的预设顺序,从编码序列的当前提取位置,提取第一预设数量的多个编码,将提取的多个编码,采用预设混淆算法进行混淆运算,得到每个编码的混淆结果,再将多个编码的混淆结果求和,得到针对当前提取位置的叠加值;当叠加值在预设范围内时,按照预设顺序,选取与当前提取位置相隔第二预设数量的编码;使用选取的编码,确定出文本的针对当前提取位置的特征值,从而生成包含文本结构信息的特征序列,消除了对特定语言的限制,增强了提取文本特征值的通用性。

著录项

  • 公开/公告号CN107967314B

    专利类型发明专利

  • 公开/公告日2022-01-21

    原文格式PDF

  • 申请/专利权人 珠海市君天电子科技有限公司;

    申请/专利号CN201711172233.X

  • 发明设计人 米明恒;

    申请日2017-11-22

  • 分类号G06F16/33(20190101);

  • 代理机构11413 北京柏杉松知识产权代理事务所(普通合伙);

  • 代理人马敬;项京

  • 地址 519070 广东省珠海市唐家湾镇港湾大道科技一路10号主楼六层601F

  • 入库时间 2022-08-23 13:02:01

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号