HowNet
HowNet的相关文献在2001年到2022年内共计89篇,主要集中在自动化技术、计算机技术、语言学、科学、科学研究
等领域,其中期刊论文80篇、会议论文3篇、专利文献6篇;相关期刊51种,包括现代图书情报技术、湖南大学学报(自然科学版)、北京信息科技大学学报(自然科学版)等;
相关会议3种,包括第六届全国信息检索学术会议、第十六届中国神经网络大会(CNNC2006)暨首届中国人工免疫系统专题会议(CAISC06)、第二届全国学生计算语言学研讨会等;HowNet的相关文献由216位作者贡献,包括何婷婷、李生、陈浩等。
HowNet
-研究学者
- 何婷婷
- 李生
- 陈浩
- 张仰森
- 王萌
- 赵铁军
- 刘鹏远
- 姬东鸿
- 孙茂松
- 赵小兵
- 刘知远
- 刘磊
- 周艳玲
- 孟凡擎
- 封化民
- 岂凡超
- 廖志芳
- 张弛
- 张旭
- 张贯虹
- 成金勇
- 昝红英
- 杨尔弘
- 杨沐昀
- 王宝群
- 王晓荣
- 王裴岩
- 董强
- 郭丽
- 高璐
- 高雪霞
- 鹿文鹏
- Chenglong Wang
- Rihong Wang
- Xingmei Cui
- Ying Xu
- 严岳松
- 乔新晓
- 于晓繁
- 于汝意
- 仇伟
- 何丰
- 俞士汶
- 元海霞
- 刁丽娜
- 刘冬明
- 刘博
- 刘城霞
- 刘宗田
- 刘挺
-
-
晁睿;
张坤丽;
王佳佳;
胡斌;
张维聪;
韩英杰;
昝红英
-
-
摘要:
多模态融合旨在将多个模态信息整合以得到一致、公共的模型输出,是多模态领域的一个基本问题。通过多模态信息的融合能获得更全面的特征并且提高模型鲁棒性,目前多模态融合技术已成为多模态领域核心研究课题之一。本文基于ImageNet、HowNet和CCD,通过人工标注构建了一个新的多模态知识库,已完成校准ImageNet中21455个名词及动词概念的映射,有效地将HowNet以及CCD中概念映射到ImageNet中。该数据集能够应用于自然语言处理任务和计算机视觉任务,并通过图片信息和概念信息提高任务效果。在图片分类中,通过增加HowNet和ImageNet概念能够融合更多的图片特征来辅助分类;在语义理解中,通过映射增加图片信息可以更好地理解语义。
-
-
陈靖元;
周刚;
卢记仓
-
-
摘要:
目前基于信息含量的中文词语相似度算法普遍使用单一的知识库,存在信息不完备的问题.本文在现有的基于HowNet信息含量的词语相似度算法和基于同义词词林信息含量的词语相似度算法基础上,改进了信息含量的计算方法,并根据词语的不同分布情况将两种算法进行动态融合,充分利用了HowNet和同义词词林中的体系结构信息,改善了现有方法的局限性.经Miller&Charles(MC30)数据集测评,该算法所得到的词语相似度值与人工判定值之间的皮尔森相关系数为0.927,验证了融合多知识库策略的可行性,也证明了本文方法在实用方面可以达到符合人类主观判断的效果.
-
-
赵超丽;
王裴岩;
蔡东风
-
-
摘要:
术语内部动态角色标注是航空领域HowNet构建的关键环节,其直接影响航空领域HowNet的规模与质量.针对动态角色种类多造成标注困难的问题,提出一种基于KN N的术语内部动态角色标注方法.通过对术语内部词语DEF项的分析进行样本预选择,并在最近邻样本选择阶段融合基于DEF的语义相似性及基于词向量的语境分布相似性.实验结果表明,1-Best、3-Best和7-Best的准确率分别为67.57%、86.00%和94.17%,平均倒数排名MRR为0.7764,优于现有的研究结果.
-
-
刘阳光;
岂凡超;
刘知远;
孙茂松
-
-
摘要:
义原(sememe)被定义为人类语言中不可再分的最小语义单位.一个词语的意义可以由多个义原的组合来表示.以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务.但传统的人工标注费时费力,而且不同的专家进行标注难免会引入标注者的主观偏差,导致标注的一致性和准确性难以保证.因此,保证词的义原标注一致性已成为建设高质量语言知识库HowNet、提升义原应用任务效果的首要任务.该文首次提出了一种对HowNet已标注的义原进行一致性检验的方法.实验结果表明,所提方法切实有效,能够很好地应用于HowNet知识库的标注一致性检验以及完善扩充.
-
-
张军亮;
方雪梅;
雒曼;
孙晶晶
-
-
摘要:
中文电子病历中存在大量非结构化的文本信息,其中的医学命名实体识别是生物医学领域知识组织和服务的基础.文章首先分析了中文电子病历特征的词语、词性、语素和词的组成等语法特征,以及HowNet语义特征;然后,运用CRF模型,提出了基于CRF医学命名实体的识别方案;最后,实验表明融合HowNet的中文电子病历命名实体识别方法具有较好的效果.
-
-
-
曹静雯;
王铁鑫;
杨志斌;
李文心
-
-
摘要:
作为自然语言处理的关键技术之一,词汇之间的语义相关性计算依赖于语义资源.语义资源可分为知识库和语料库;HowNet和ConceptNet是包含中文词汇的两种语义知识库,可为中文词汇语义相关性计算提供依据.本文在分析以上两种语义知识库结构及应用的基础上,提出:面向HowNet的基于信息含量的语义相关性计算方法,以及面向ConceptNet的基于路径距离的语义相关性计算方法.通过实验案例分析,得出如下结论:HowNet明确定义词汇的概念,适用于检测词对间的语义相似度;ConceptNet定义词对间的多重语义关系,在检测词对语义相似度的基础上,亦能检测词对间的语义相关度.此外,本文探索性地提出结合使用以上两种语义知识库的词对间语义关系计算算法,以期扩大检索词汇的范围并提高效率.
-
-
-
黄俊义
-
-
摘要:
随着科学技术的迅猛发展,提高农业的科技化水平成为了学术界的重要研究内容.此次利用K-means算法与BIRCH算法,在建立农业科技推广服务系统语义分析算法模型的基础上,设计了农业科技推广服务系统,系统设计主要从功能需求、体系搭建以及项目相似度计算等方面入手.该系统可以根据用户评论,量化用户的技术情感倾向,从而为用户推荐个性化的农业技术.研究中,以3500条农业评论数据为样本,对该模型进行了核心功能验证与性能测试,核心功能实现结果表明,系统的核心功能实现度高,可以较好满足农业用户的技术需求.性能测试数据显示,该设计系统的性能测试指标值较高,系统总体性能良好.该研究对于农业科技推广具有一定的借鉴意义.
-
-
于汝意;
刘秀磊;
刘旭红;
张良;
王延飞
-
-
摘要:
针对泛娱乐情报存在繁杂、异构、信息量较少的特点以及传统主题发现方法感知结果准确率低等问题,提出了一种基于潜在语义索引结合常识知识库的泛娱乐情报主题感知方法.根据泛娱乐情报的语料特征,首先在预处理阶段采用HowNet知识库进行语义去重、同义词合并,形成文本向量作为潜在语义索引模型的输入;然后通过潜在语义索引模型,对泛娱乐情报进行主题感知.该方法是主题模型在泛娱乐领域情报分析中的一次尝试,具有一定的实践意义.
-
-
王萌;
何婷婷;
王晓荣
- 《第二届全国学生计算语言学研讨会》
| 2004年
-
摘要:
本文首先基于hownet对多义词进行无导词语消歧处理,然后利用hownet建立的知识库获取文章中词语的概念,并对未登录词语进行概念标注.用概念统计代替传统的词形频率统计方法,选择出与主题相关的若干概念,建立主题概念向量空间模型;通过段落聚类的算法计算出段落重要度;利用段落重要度和主题概念向量空间模型计算出句子重要度,抽取文摘句.通过对抽取的语句进行句子相似度的计算来提高文摘精确度,设计并实现了一个中文自动文摘系统.
-
-
-
-
-
-
-
-
-