句子相似度
句子相似度的相关文献在2001年到2022年内共计183篇,主要集中在自动化技术、计算机技术、语言学、信息与知识传播
等领域,其中期刊论文139篇、会议论文15篇、专利文献149250篇;相关期刊73种,包括人天科学研究、现代图书情报技术、北京信息科技大学学报(自然科学版)等;
相关会议14种,包括SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)、第十三届中国少数民族语言文字信息处理学术研讨会、第六届全国信息检索学术会议等;句子相似度的相关文献由395位作者贡献,包括王宇、张培颖、刘挺等。
句子相似度—发文量
专利文献>
论文:149250篇
占比:99.90%
总计:149404篇
句子相似度
-研究学者
- 王宇
- 张培颖
- 刘挺
- 周艳平
- 张仰森
- 杨思春
- 秦兵
- 刘建舟
- 卡哈尔江·阿比的热西提
- 吐尔根·依布拉音
- 吕学强
- 李景玉
- 李金鹏
- 艾山·吾买尔
- 蔡东风
- 侯丽敏
- 刘占一
- 刘惠文
- 刘文静
- 刘晓华
- 刘松平
- 化柏林
- 吴华
- 吴成龙
- 周法国
- 姚海鹏
- 孙伟
- 尚游
- 张克亮
- 张再跃
- 张卫山
- 张孝飞
- 张琳
- 李为民
- 李兆兆
- 李婧
- 李斯佳
- 李生
- 李秋明
- 李维
- 李自荐
- 杨炳儒
- 段宏宇
- 沈磊
- 熊晶
- 王广涛
- 王晨龙
- 王洋
- 王海峰
- 王铁鑫
-
-
黄少滨;
孙雪薇;
李熔盛
-
-
摘要:
关系分类作为信息抽取的核心任务和重要环节,能够实现实体对间语义关系的识别。近年来,深度学习在关系抽取任务中取得了显著的成果。到目前为止,研究者们的努力方向主要集中在对神经网络模型进行改进,但是对于不同句子之间语义关系密切的文本类型尚缺乏有效的方法来获取段落或篇章级别的跨句语义信息。针对此类段落或篇章级的关系抽取数据集,提出了一种将句子结合其跨句上下文信息共同作为神经网络模型输入的方法,使模型能够学习到更多段落或篇章级别的语义关联信息。在不同的神经网络模型上,分别引入了跨句上下文信息,并在不同领域的两个关系分类数据集上进行了实验,对比了引入跨句上下文信息与否对模型精度的影响,实验表明该方法能够有效提升神经网络模型的关系分类性能。此外,提出了一个基于四险一金领域政策法规文本的关系分类数据集Policy,用于验证在某些实际领域的关系分类任务中引入跨句上下文信息的必要性。
-
-
袁绍正;
周艳平
-
-
摘要:
针对现有的句子相似度计算方法没有考虑句子中的关键词的多属性信息,无法更好衡量句子相似度的问题,综合考虑句子的结构和包含的属性,提出一种基于句子的多属性融合相似度计算方法.该方法通过提取句子的词频属性、词序属性、词性属性及句长属性,采用层次分析法(AHP)计算出各属性的权重,并验证权重值的合理性,继而加权融合4种属性的相似度.将本文提出的多属性融合相似度计算方法在构建的数据集上进行实验,验证此方法的可靠性及可行性,并以召回率、准确率以及归一化F-度量值为标准和其他传统方法进行对比分析,结果表明,该方法不仅有着均衡的召回率和准确率,且F-度量值较高,达到83.57%.
-
-
申震;
王逊;
黄树成;
周尓昊
-
-
摘要:
针对现有的句子相似度计算中仅考虑单个词语的语义信息,而忽略了句子的语法结构信息的问题,提出了一种结合依存句法分析和词语语义相似度的计算方法.使用哈工大社会计算与信息检索研究中心研发的语言技术平台对句子进行句法分析获得依存句法分析树,从中构造包含句子成分、依存关系、词语等多特征信息的依存关系三元组.采用动态加权的方法充分利用词语在知网与同义词词林中的语义信息,通过依存关系三元组体现句子语法结构和词语语义两个层面上的语义信息,提高了相似度计算的合理性,并且扩大了可计算相似度的词语范围.实验表明:该相似度计算方法的准确性相比同类方法有了一定的提高,能更为准确的衡量句子间的相似度.
-
-
孟冰卿;
马雷
-
-
摘要:
量子理论所具备的叠加、纠缠、不相容和干涉等特征使其成为优秀的建模框架.研究了量子理论在自然语言理解方面的应用潜力.在自然语言句子匹配任务上,探讨了量子理论作为一种形式化框架捕捉句子、词语的语义和语义建模上的能力:利用量子态构建句子的语义Hilbert空间,计算句子信息变换过程中信息的保真度;与此同时,将量子理论与Word Embedding技术巧妙结合,在高维低秩向量空间中表示单词或概念,求取句子的相似性.在一个真实业务场景中构造的问句匹配数据集上,模拟数据表明,所提出的方法相比于经典方法取得了更好的效果,为以后进行多个句子的相似度研究提供了新的思路,也是计算机科学与量子理论学科交叉研究领域的一个突破,符合当下研究的方向.
-
-
冯进展;
蔡淑琴
-
-
摘要:
及时有效地处理负面在线评论能提高企业的声誉和维护消费者对企业的信任,而面对大量的负面在线评论,企业很难在短期内及时有效回复.根据在线评论是短文本的特点,运用基于句子相似度的负面在线评论进行案例推理处理.针对负面在线评论句子相似度计算问题,抽取句子中评价对象词和评价词作为关键词,同时考虑评价词的修饰词和句子语义依存关联对.除提出的关键词、修饰词、语义依存分析关联对三个特征外,再融入句子中的公共词、语义等两个特征,提出一种融合公共词、关键词、修饰词、语义、语义依存分析关联对等五个特征的句子相似度计算方法,检索相似负面评论句子的案例.通过实验验证,融入多特征的句子相似度计算优于常见句子相似度计算方法,其准确率为83.3%,有效地检索案例句子集并自动推荐回复方案.
-
-
杨延娇;
赵国涛;
王丕栋
-
-
摘要:
针对汉语语句表意灵活复杂多变的特点,提出一种基于语义与情感的句子相似度计算方法,从表意层面计算句子相似度.该方法使用哈工大LTP平台对句子进行预处理,提取词语、词性、句法依存标记与语义角色标记,将语义角色标注结果作为句中语义独立成分赋予相似度权重系数,综合句法依存关系与词法关系计算两句相同标签语义独立成分相似度得到部分相似度,加权计算部分相似度得到句子整体相似度.另外,考虑到情感与句式因子,在整体相似度的基础上对满足条件的两句计算情感减益与句式减益.实验结果表明,该方法能有效提取出句子语义独立成分,从语义层面上计算句子相似度,解决了信息遗漏与句子组成成分不一致的问题,提高了句子相似度计算的准确率与鲁棒性.
-
-
王铁鑫;
刘文静;
杨志斌;
曹静雯
-
-
摘要:
针对英文句子相似度计算问题,提出基于框架语义(frame semantics)的分析计算方法.对比传统基于关键词及句子结构等计算方法,提出的方法考虑整个句子的语义信息,即关键词的上下文信息,以提高相似度计算结果的准确性.该方法建立在框架语义库FrameNet之上,并结合使用语义框架抽取工具Semafor及命名实体抽取工具NER,以减少人工参与,提高方法的执行效率.通过扩展FrameNet中的语义框架类别,应对部分关键词无法激起框架的问题;通过量化框架间语义关系并定义计算规则,实现句子间相似度的计算与判断.在标准测试集上的实验结果表明,该方法的计算结果在准确率、召回率等评价指标上,优于传统方法.
-
-
李美玲;
任亚伟;
孙军梅;
李秀梅;
何鑫睿
-
-
摘要:
智能客服利用人工智能技术准确回答用户的咨询问题, 良好的句子相似度算法可以提高智能客服中问答的准确度.本文针对金融证券领域客服, 提出了基于多特征融合的句子相似度算法模型, 提高了客服的智能性. 通过矩阵拼接的方式, 融合用户提问语句和知识库语句的词形特征和语义特征, 其中词形特征考虑N-gram相似度、编辑距离、Jaccard相似度三种词形信息, 并针对语义特征提取, 提出了基于多头注意力机制(multi-head attention)的神经网络模型LBMA. 利用上述融合的特征, 运用机器学习分类器判断两个语句是否相似, 并将分类器分类结果作为多特征融合模型的计算结果. 在尽量不改变语义信息的前提下, 通过数据增强(Data Augmentation, DA)技术扩充数据集, 提升了模型泛化能力. 实验结果表明, 与已有方法相比, 该模型在智能客服数据集上能够有效提升相似度计算的准确性, 准确率达到94.69%.
-
-
王新;
朱九杨
-
-
摘要:
在英汉翻译策略研究过程中,受到翻译模型的影响,当前策略翻译效率较低.本研究提出句子相似度挖掘下英汉翻译策略研究:将待翻译的句子转换成为字符串,并从中提取出语境特征;依托于模糊匹配技术,从短语表内找到与语境特征相对应的短语;从结构和语义两方面入手,获取句子相似度结果.本研究通过设置的相似度阈值建立类比相似关系,最终实现翻译效率的提升;提出直译翻译、套译翻译以及意译翻译策略,根据具体的翻译场景,选择合适的翻译策略实现句子相似度挖掘下英汉翻译.
-
-
李景玉
-
-
摘要:
孪生网络因自身特点被应用于句子相似度计算,但若模型只关注构成句子本身的词语,是无法获得该词语更多的语义信息的.针对这一问题,该文基于BERT模型,提出基于BERT的孪生网络计算句子语义相似度的方法,该方法通过BERT模型,得到具有丰富语义信息的句子向量,再利用该向量在孪生网络中计算相似度.在公开数据集LCQMC上的实验结果表明,基于BERT的孪生网络计算句子语义相似度方法的Accuracy优于基于卷积孪生网络计算句子语义相似度方法.
-
-
-
宋彦;
张桂平;
蔡东风
- 《第九届全国计算语言学学术会议》
| 2007年
-
摘要:
在基于大规模双语语料库的机器翻译研究中,如何找到最有效的翻译参考一直以来都是人们的关注焦点,其核心技术就是参考例句的相似度计算。本文提出了一种基于HowNet词语相似度的N-gram相似度计算方法,在此基础之上,参考机器翻译自动评测中BLEU的评价公式,进一步提出了一种新的句子相似度计算方法。该方法结合了N-gram和语义相似度计算,可以有效应用到基于实例的机器翻译、辅助机器翻译和交互式机器翻译中。
-
-
周法国;
杨炳儒
- 《第七届中文信息处理国际会议》
| 2007年
-
摘要:
计算句子的相似度在机器问答系统,基于实例的机器翻译,文本分类等自然语言处理的许多领域中都有着非常重要的作用。该文对基于相同关键词的句子相似模型做了进一步的改进,包括关键词抽取,以及在句子相似度的定义中引入同义词以及近义词的情形.实验结果表明,改进方法比以前方法具有较高的准确率。
-
-
-
-
- 《中国人工智能学会计算机辅助教育专业委员会(全国CBE学会)第十三届学术年会》
| 2008年
-
摘要:
智能答疑系统至今很难取得实用性成果,一个主要原因是其关键技术——句子相似度计算方法存在局限性。现有的句子相似度计算方法都属于浅层的语法分析,主要缺陷是难以解决"一义多词"和"一义多句"问题。只有深入到语义分析层次才能彻底解决这些问题,因此提出一种基于句义机构匹配的句子相似度计算方法.为了实现该方法,首先建立了一个通用的句义结构模型,归纳了从句法结构映射为句义结构的分析规则,然后实现了句义结构匹配的算法.该方法应用到中文智能答疑系统KRQA中,取得了较好的效果.
-
-
余正涛;
北京理工大学计算机科学工程系;
胡磊;
汤世平;
郭剑毅
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
分析了当前常用的汉语句子相似度计算方法及存在的问题,针对中文问句的特点,定义了问句的常规和特定语块,提出了一种基于语块的中文问句相似度计算方法,该方法以"知网"为基础,计算词语语义相似度,利用组块分析理论及HMM学习算法,识别问句常规语块,利用规则或学习方法提取问句特定语块,并分别计算两个问句中各问句语块之间的相似度,最终以语块相似度为基础实现问句相似度的计算.问句相似度计算方法对比实验结果说明,提出的方法具有更好的效果。
-
-
-
-
-
-
-
-
-
-
- 重庆邮电大学
- 公开公告日期:2022.10.18
-
摘要:
本发明请求保护一种句子相似度计算方法,包括以下步骤:步骤(1),获取句子相似度计算的测试集和训练集,并通过词向量模型获取各词语对应的语义向量;步骤(2),基于词语权重的句向量,分别计算测试集中某一测试句子与训练集中每个训练句子的余弦相似度;步骤(3),基于词序的句向量,分别计算上述测试句子和由步骤(2)的结果筛选出的相似度前10的句子的相似度;步骤(4),基于步骤(2)和步骤(3)得到的两种句子向量计算的句子相似度,并采用MRR(平均排序倒数)参数确定方法来调节优化系数β,得出与训练集中句子相似度最大的句子。由于本发明考虑了影响句子相似度的词语权重和词序因素来计算,大大提高了句子相似度计算的精准度。
-
-
-
-