首页> 中国专利> 一种基于最大凝聚系数和边界熵的未登录词识别方法

一种基于最大凝聚系数和边界熵的未登录词识别方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提供了一种基于最大凝聚系数和边界熵的未登录词识别方法，其特征在于：包括以下步骤：预处理—参数计算—判断未登录词—未登录词保存至文件—未登录词添加；本发明中实验表明，本发明中所提出的算法准确率为66.67％相比于汪龙庆等在计算机应用与软件期刊中所发表的论文：基于未登录词识别的微博评价短语抽取方法中所提出的算法准确率为60.05％有较大程度的提高，提升了6.62个百分点，并且分别在未登录词识别的精确率、召回率和F1值也有所改善，推测结果提高的原因是左右邻接边界熵这两个参数对未登录词识别都有影响，但汪龙庆等的论文中中将左右邻接边界熵最小值设为一个参数，只是取其中最小值为影响未登录词识别算法的因素。

著录项

公开/公告号CN112199943A

专利类型发明专利
公开/公告日2021-01-08

原文格式PDF
申请/专利权人东北大学;
展开▼

申请/专利号CN202011013194.0
发明设计人韩东红;齐孝龙;杨百玉;蔡从浩;王波涛;刘辉林;
展开▼

申请日2020-09-24
分类号G06F40/216(20200101);G06F40/242(20200101);G06F40/289(20200101);
代理机构44681 广东有知猫知识产权代理有限公司;
代理人王臻巍
地址 110004 辽宁省沈阳市和平区文化路三巷11号
入库时间 2023-06-19 09:29:07

法律信息

法律状态公告日

法律状态信息

法律状态
2023-10-03

授权

发明专利权授予

相似文献

专利
中文文献
外文文献

1. 一种基于最大凝聚系数和边界熵的未登录词识别方法 [P] . 中国专利： CN112199943A . 2021-01-08
2. 一种水声传感网中基于信息熵最大化的流体边界提取方法 [P] . 中国专利： CN113179135A . 2021-07-27
3. Bit boundary detection method for global positioning system, involves utilizing index of largest element of determination vector formed based on received signal, to indicate bit boundary [P] . FI109311B . 2002-06-28

机译：全球定位系统的比特边界检测方法，涉及利用基于接收信号形成的确定矢量的最大元素的索引来指示比特边界
4. Load identification method for reciprocating machinery based on information entropy and envelope features of axis trajectory of piston rod [P] . US11231038B2 . 2022-01-25

机译：基于信息熵的轴向轨迹互换机械的负载识别方法
5. Emotion Recognition Method based on Multivariate Multiscale Fuzzy Entropy Analysis of EEG recordings [P] . KR20210045703A . 2021-04-27

机译：基于多变量多尺度模糊熵分析EEG录制的情感识别方法