您现在的位置: 首页> 研究主题> 句子相似度

句子相似度

句子相似度的相关文献在2001年到2022年内共计183篇,主要集中在自动化技术、计算机技术、语言学、信息与知识传播 等领域,其中期刊论文139篇、会议论文15篇、专利文献149250篇;相关期刊73种,包括人天科学研究、现代图书情报技术、北京信息科技大学学报(自然科学版)等; 相关会议14种,包括SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)、第十三届中国少数民族语言文字信息处理学术研讨会、第六届全国信息检索学术会议等;句子相似度的相关文献由395位作者贡献,包括王宇、张培颖、刘挺等。

句子相似度—发文量

期刊论文>

论文:139 占比:0.09%

会议论文>

论文:15 占比:0.01%

专利文献>

论文:149250 占比:99.90%

总计:149404篇

句子相似度—发文趋势图

句子相似度

-研究学者

  • 王宇
  • 张培颖
  • 刘挺
  • 周艳平
  • 张仰森
  • 杨思春
  • 秦兵
  • 刘建舟
  • 卡哈尔江·阿比的热西提
  • 吐尔根·依布拉音
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

期刊

    • 黄少滨; 孙雪薇; 李熔盛
    • 摘要: 关系分类作为信息抽取的核心任务和重要环节,能够实现实体对间语义关系的识别。近年来,深度学习在关系抽取任务中取得了显著的成果。到目前为止,研究者们的努力方向主要集中在对神经网络模型进行改进,但是对于不同句子之间语义关系密切的文本类型尚缺乏有效的方法来获取段落或篇章级别的跨句语义信息。针对此类段落或篇章级的关系抽取数据集,提出了一种将句子结合其跨句上下文信息共同作为神经网络模型输入的方法,使模型能够学习到更多段落或篇章级别的语义关联信息。在不同的神经网络模型上,分别引入了跨句上下文信息,并在不同领域的两个关系分类数据集上进行了实验,对比了引入跨句上下文信息与否对模型精度的影响,实验表明该方法能够有效提升神经网络模型的关系分类性能。此外,提出了一个基于四险一金领域政策法规文本的关系分类数据集Policy,用于验证在某些实际领域的关系分类任务中引入跨句上下文信息的必要性。
    • 袁绍正; 周艳平
    • 摘要: 针对现有的句子相似度计算方法没有考虑句子中的关键词的多属性信息,无法更好衡量句子相似度的问题,综合考虑句子的结构和包含的属性,提出一种基于句子的多属性融合相似度计算方法.该方法通过提取句子的词频属性、词序属性、词性属性及句长属性,采用层次分析法(AHP)计算出各属性的权重,并验证权重值的合理性,继而加权融合4种属性的相似度.将本文提出的多属性融合相似度计算方法在构建的数据集上进行实验,验证此方法的可靠性及可行性,并以召回率、准确率以及归一化F-度量值为标准和其他传统方法进行对比分析,结果表明,该方法不仅有着均衡的召回率和准确率,且F-度量值较高,达到83.57%.
    • 申震; 王逊; 黄树成; 周尓昊
    • 摘要: 针对现有的句子相似度计算中仅考虑单个词语的语义信息,而忽略了句子的语法结构信息的问题,提出了一种结合依存句法分析和词语语义相似度的计算方法.使用哈工大社会计算与信息检索研究中心研发的语言技术平台对句子进行句法分析获得依存句法分析树,从中构造包含句子成分、依存关系、词语等多特征信息的依存关系三元组.采用动态加权的方法充分利用词语在知网与同义词词林中的语义信息,通过依存关系三元组体现句子语法结构和词语语义两个层面上的语义信息,提高了相似度计算的合理性,并且扩大了可计算相似度的词语范围.实验表明:该相似度计算方法的准确性相比同类方法有了一定的提高,能更为准确的衡量句子间的相似度.
    • 孟冰卿; 马雷
    • 摘要: 量子理论所具备的叠加、纠缠、不相容和干涉等特征使其成为优秀的建模框架.研究了量子理论在自然语言理解方面的应用潜力.在自然语言句子匹配任务上,探讨了量子理论作为一种形式化框架捕捉句子、词语的语义和语义建模上的能力:利用量子态构建句子的语义Hilbert空间,计算句子信息变换过程中信息的保真度;与此同时,将量子理论与Word Embedding技术巧妙结合,在高维低秩向量空间中表示单词或概念,求取句子的相似性.在一个真实业务场景中构造的问句匹配数据集上,模拟数据表明,所提出的方法相比于经典方法取得了更好的效果,为以后进行多个句子的相似度研究提供了新的思路,也是计算机科学与量子理论学科交叉研究领域的一个突破,符合当下研究的方向.
    • 冯进展; 蔡淑琴
    • 摘要: 及时有效地处理负面在线评论能提高企业的声誉和维护消费者对企业的信任,而面对大量的负面在线评论,企业很难在短期内及时有效回复.根据在线评论是短文本的特点,运用基于句子相似度的负面在线评论进行案例推理处理.针对负面在线评论句子相似度计算问题,抽取句子中评价对象词和评价词作为关键词,同时考虑评价词的修饰词和句子语义依存关联对.除提出的关键词、修饰词、语义依存分析关联对三个特征外,再融入句子中的公共词、语义等两个特征,提出一种融合公共词、关键词、修饰词、语义、语义依存分析关联对等五个特征的句子相似度计算方法,检索相似负面评论句子的案例.通过实验验证,融入多特征的句子相似度计算优于常见句子相似度计算方法,其准确率为83.3%,有效地检索案例句子集并自动推荐回复方案.
    • 杨延娇; 赵国涛; 王丕栋
    • 摘要: 针对汉语语句表意灵活复杂多变的特点,提出一种基于语义与情感的句子相似度计算方法,从表意层面计算句子相似度.该方法使用哈工大LTP平台对句子进行预处理,提取词语、词性、句法依存标记与语义角色标记,将语义角色标注结果作为句中语义独立成分赋予相似度权重系数,综合句法依存关系与词法关系计算两句相同标签语义独立成分相似度得到部分相似度,加权计算部分相似度得到句子整体相似度.另外,考虑到情感与句式因子,在整体相似度的基础上对满足条件的两句计算情感减益与句式减益.实验结果表明,该方法能有效提取出句子语义独立成分,从语义层面上计算句子相似度,解决了信息遗漏与句子组成成分不一致的问题,提高了句子相似度计算的准确率与鲁棒性.
    • 王铁鑫; 刘文静; 杨志斌; 曹静雯
    • 摘要: 针对英文句子相似度计算问题,提出基于框架语义(frame semantics)的分析计算方法.对比传统基于关键词及句子结构等计算方法,提出的方法考虑整个句子的语义信息,即关键词的上下文信息,以提高相似度计算结果的准确性.该方法建立在框架语义库FrameNet之上,并结合使用语义框架抽取工具Semafor及命名实体抽取工具NER,以减少人工参与,提高方法的执行效率.通过扩展FrameNet中的语义框架类别,应对部分关键词无法激起框架的问题;通过量化框架间语义关系并定义计算规则,实现句子间相似度的计算与判断.在标准测试集上的实验结果表明,该方法的计算结果在准确率、召回率等评价指标上,优于传统方法.
    • 李美玲; 任亚伟; 孙军梅; 李秀梅; 何鑫睿
    • 摘要: 智能客服利用人工智能技术准确回答用户的咨询问题, 良好的句子相似度算法可以提高智能客服中问答的准确度.本文针对金融证券领域客服, 提出了基于多特征融合的句子相似度算法模型, 提高了客服的智能性. 通过矩阵拼接的方式, 融合用户提问语句和知识库语句的词形特征和语义特征, 其中词形特征考虑N-gram相似度、编辑距离、Jaccard相似度三种词形信息, 并针对语义特征提取, 提出了基于多头注意力机制(multi-head attention)的神经网络模型LBMA. 利用上述融合的特征, 运用机器学习分类器判断两个语句是否相似, 并将分类器分类结果作为多特征融合模型的计算结果. 在尽量不改变语义信息的前提下, 通过数据增强(Data Augmentation, DA)技术扩充数据集, 提升了模型泛化能力. 实验结果表明, 与已有方法相比, 该模型在智能客服数据集上能够有效提升相似度计算的准确性, 准确率达到94.69%.
    • 王新; 朱九杨
    • 摘要: 在英汉翻译策略研究过程中,受到翻译模型的影响,当前策略翻译效率较低.本研究提出句子相似度挖掘下英汉翻译策略研究:将待翻译的句子转换成为字符串,并从中提取出语境特征;依托于模糊匹配技术,从短语表内找到与语境特征相对应的短语;从结构和语义两方面入手,获取句子相似度结果.本研究通过设置的相似度阈值建立类比相似关系,最终实现翻译效率的提升;提出直译翻译、套译翻译以及意译翻译策略,根据具体的翻译场景,选择合适的翻译策略实现句子相似度挖掘下英汉翻译.
    • 李景玉
    • 摘要: 孪生网络因自身特点被应用于句子相似度计算,但若模型只关注构成句子本身的词语,是无法获得该词语更多的语义信息的.针对这一问题,该文基于BERT模型,提出基于BERT的孪生网络计算句子语义相似度的方法,该方法通过BERT模型,得到具有丰富语义信息的句子向量,再利用该向量在孪生网络中计算相似度.在公开数据集LCQMC上的实验结果表明,基于BERT的孪生网络计算句子语义相似度方法的Accuracy优于基于卷积孪生网络计算句子语义相似度方法.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号