您现在的位置: 首页> 研究主题> 语义相似性

语义相似性

语义相似性的相关文献在1992年到2022年内共计114篇,主要集中在自动化技术、计算机技术、测绘学、心理学 等领域,其中期刊论文83篇、会议论文8篇、专利文献452022篇;相关期刊56种,包括情报学报、测绘科学技术学报、浙江大学学报(工学版)等; 相关会议8种,包括第六届全国地理信息科学博士生学术论坛、第四届和谐人机环境联合学术会议、第二届全国Web信息系统及其应用会议(WISA2005')等;语义相似性的相关文献由339位作者贡献,包括何克清、卫金茂、周向东等。

语义相似性—发文量

期刊论文>

论文:83 占比:0.02%

会议论文>

论文:8 占比:0.00%

专利文献>

论文:452022 占比:99.98%

总计:452113篇

语义相似性—发文趋势图

  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 左玉生; 张礼
    • 摘要: 为了提高文本语义相似性度量的准确性,该文从深度学习的角度出发提出了一种新的文本语义相似性度量框架,充分利用深度神经网络实现词级别、句子级别、文本级别的表示学习,使得学习到的表示向量能提供融合上下文信息的丰富语义信息,在此基础上,设计了相似性度量层,采用简单的三层网络实现任意两个文本向量的相似性值计算。在两个基准数据集上进行了试验验证,试验结果表明提出的文本语义相似性度量能准确地度量文本相似性,在MPRC和SNLI数据集上分别获得了89.33%和94.53%的F1-score值,优于选取的对比方法。
    • 魏江南; 皋军; 热甫凯提
    • 摘要: 医护人员在处理医疗不良事件时,大多依靠个人主观经验给出解决方案。采用知识图谱特征学习和协同过滤算法相结合的方式对医院长期积累的不良事件数据集进行采集训练,为医护人员提供最优解决方案。首先通过知识图谱训练算法将不良事件中的病人信息转化为低纬向量,采用余弦相似度算法计算出病人的相似矩阵;再通过协同过滤算法依靠事件基本信息计算出不良事件的相似矩阵;最后将两者结合为一个推荐结果集。该算法提供的推荐结果集正确率比传统方法平均提高35%,不仅减轻了医护人员的负担,还有助于管理层更有效地追溯责任人。
    • 周倩; 王逊; 李灵慧; 黄树成; 王云沼
    • 摘要: 传统的图书推荐算法只考虑外部评分数据,且会面临物品冷启动等问题。本文将图书外部评分数据与图书内涵知识相结合,提出融合知识图谱和协同过滤的图书推荐算法。首先通过基于知识图谱的训练将图书的语义信息转化为低维向量矩阵,利用余弦相似度公式计算图书间的语义相似度,增加新图书与其他图书的相似性,根据图书语义相似矩阵获取图书的语义近邻。同时,改进协同过滤相似性计算方法,根据图书外部评分矩阵获取图书评分近邻,最后将评分近邻与语义近邻相结合,得到最终的图书推荐结果集。该算法在Book-Crossing数据集上进行测试,实验结果表明算法精确率提高到4.37%,比传统方法提高了0.69%,并且比其他相关算法有更好的表现。
    • 陈嫣然; 梁正; 赵庆柏; 黄宇; 李松清; 于全磊; 周治金
    • 摘要: 通过描绘发散性思维测验(物品多用途,AUT)中答案生成在累积函数和语义相似性等一系列参数上的量化特征,揭示创造性思维的语义搜索过程。结果发现:(1)新颖AUT条件中,语义搜索呈现与自由联想类似的负加速特点,但搜索速度较寻常AUT条件更慢。(2)新颖AUT条件中所生成的答案与题目(即物品)均具有较低的语义相似性,且显著小于寻常AUT条件。(3)新颖AUT条件中生成的答案比寻常AUT条件表现出显著更低的聚类程度,其中可聚类答案和未聚类答案与题目的语义相似度均较低,且不存在显著差异,二者在新颖性上也不存在显著差异。以上结果说明了创造性思维的语义信息搜索过程具有与自由联想类似的激活扩散特征,但总体搜索速度较慢。新颖性要求使得个体在最初搜索时便开始摆脱题目的语义限制而进行远距离搜索(避免就近搜索),并倾向于在每个语义场中只生成一个答案(避免局部搜索),但也可能会在远离题目的语义场中生成多个同类别答案。
    • 牛奉高; 高旭霞
    • 摘要: 随着文本信息的迅猛增长,数据挖掘已成为知识发现的重要方法.短文本相似性(short text similarity,STSim)度量是数据挖掘研究的重要技术.为了更好的提高短文本相似性度量精度,本文提出了基于加权网络改进的中文短文本相似性度量的一种新模型.首先,基于词语间的共现频次对语义网络进行加权,利用加权复杂网络表征短文本;其次,考虑短文本加权复杂网络权重识别度低的特点及每个词语节点的位置,计算短文本中每个词语的加权复杂网络综合特征值;最后,根据新模型计算短文本相似性,并通过聚类实验评价其优劣.实验结果表明,新提出的相似性度量模型优于STSim模型.
    • 潘亚峰; 朱俊虎; 周天阳
    • 摘要: APT攻击已经成为网络安全的重要威胁之一,从大量告警日志数据中识别APT攻击并还原攻击场景已成为当前急需研究的问题.首先介绍了攻击场景重构基本概念和技术流程框架.其次,依据采用的关联分析方法,对攻击场景重构方法进行了分类,并分别综述了基于经验知识、基于因果关系、基于语义相似性和基于机器学习4类方法的基本步骤和具体案例.最后,讨论了不同方法的优势和不足,结合最新技术应用指出了未来发展趋势.
    • 袁中臣; 马宗民
    • 摘要: 在软件重用中,软件设计重用受到关注.UML类图被广泛应用于软件设计,UML类图的重用已经成为软件设计重用研究的重点.随着可重用的UML类图数量的不断增加,分类成为一项基础性工作.一个新的基于语义的UML类图的两级分类被提出.定义了类图之间的语义相似性度量,提出了行最大值捕捉算法获取中心类图来标识每个类别特征,基于改进的KNN(K邻近)算法构建了一个新的集成分类器E-KNN(ExtensibleKNN).从分类质量和效率上验证了所构建分类器的有效性.
    • 石晨; 张宇; 胡博
    • 摘要: 为了实现大型语料库中近义词/同义词短语的查找,提出了一种基于共同语境的近义词/同义词短语查找模型,它通过n-gram分布式方法捕获语义相似性,不需要解析就能隐式地保存局部句法结构,使底层方法语言独立;具体实现分为两个阶段:第一阶段是上下文收集和过滤,即用围绕查询短语的本地上下文作为条件模型的特征来捕获语义和语法信息.第二阶段是候选词短语收集和筛选,即对数据中的每个"左""右"和"配对"的全部实例进行迭代,以收集一组近义词/同义词候选短语;还给出了构成模型的要素和用于评价模型性能的评分函数;基于不同大型语料库的实验结果表明,提出的建模方法在总的统计评分查找性能和整体可扩展性方面都优于常用的其他查找方法模型.
    • 罗月童; 汪涛; 杨梦男; 张延孔
    • 摘要: 随着智慧城市的不断发展,基于交通卡口自动获取车辆行车轨迹,为基于轨迹的车辆行为分析奠定了基础.但是,因为卡口的位置固定,车辆轨迹表示为卡口序列,所以文中首先将卡口和轨迹分别映射为单词和句子,应用语句的语义相似性方法计算轨迹相似性;然后在轨迹相似性的基础上提出轨迹熵,用轨迹熵度量某个车辆所有轨迹的规律性;最后基于轨迹熵分析车辆的行为特征,如轨迹熵低的车辆意味着行车特别有规律,很可能是通勤车.为便于用户进行深入分析,文中进一步提供了包含多联动视图的可视分析系统,允许用户观察和比较车辆轨迹和轨迹熵,结合聚类分析和相关交互,帮助用户发现有意义的车辆行为,如上下班的通勤车的轨迹熵较低、游街模式的出租车轨迹熵很高.对昆明市2019年2月份的卡口数据集进行了分析,结果表明所提方法能有效发现不同轨迹熵区间内的车辆出行行为及其特点,证明了所提方法的有效性.
    • 谢金峰; 王羽; 葛唯益; 徐建
    • 摘要: 关系检测是知识库问答的关键步骤,直接影响问答质量.现有方法中基于编码比较的方法提取文本整体语义进行匹配会丢失序列的局部信息,而基于交互的方法在文本低层表征层面进行比较会忽略全局语义.针对现有方法无法兼顾全局语义和局部语义信息的问题,提出了一种基于多语义相似性的关系检测模型,通过BERT模型分别对问题和关系进行语义表示,然后引入注意力机制、双向长短期记忆网络和多层感知机进行局部关联性分析;利用BERT计算出的句向量中含有序列的全局语义信息,设计了问题和关系句向量的全局相似度度量.在基准数据集SimpleQuestions和WebQSP上进行了实验验证,所提方法分别取得了93.92%和87.81%的准确率,优于其他现有的方法.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号