您现在的位置: 首页> 研究主题> 语义匹配

语义匹配

语义匹配的相关文献在1997年到2023年内共计405篇,主要集中在自动化技术、计算机技术、测绘学、语言学 等领域,其中期刊论文173篇、会议论文21篇、专利文献43135篇;相关期刊107种,包括东南大学学报(自然科学版)、电子设计工程、计算机工程等; 相关会议17种,包括第二届中国指挥控制大会、2012年第三届中国计算机学会服务计算学术会议、2011年中国计算机学会服务计算学术会议(CCF NCSC2011)等;语义匹配的相关文献由1007位作者贡献,包括鹿文鹏、于瑞、张旭等。

语义匹配—发文量

期刊论文>

论文:173 占比:0.40%

会议论文>

论文:21 占比:0.05%

专利文献>

论文:43135 占比:99.55%

总计:43329篇

语义匹配—发文趋势图

语义匹配

-研究学者

  • 鹿文鹏
  • 于瑞
  • 张旭
  • 赵鹏宇
  • 左有慧
  • 罗安
  • 刘淇
  • 吴乐
  • 张琨
  • 李渊
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 向露; 周玉; 宗成庆
    • 摘要: 双语术语对齐库是自然语言处理领域的重要资源,对于跨语言信息检索、机器翻译等多语言应用具有重要意义.双语术语对通常是通过人工翻译或从双语平行语料中自动提取获得的.然而,人工翻译需要一定的专业知识且耗时耗力,而特定领域的双语平行语料也很难具有较大规模.但是同一领域中各种语言的单语术语库却较易获得.为此,提出一种基于两种不同语言的单语术语库自动实现术语对齐,以构建双语术语对照表的方法.该方法首先利用多个在线机器翻译引擎通过投票机制生成目标端"伪"术语,然后利用目标端"伪"术语从目标端术语库中检索得到目标端术语候选集合,最后采用基于mBERT的语义匹配算法对目标端候选集合进行重排序,从而获得最终的双语术语对.计算机科学、土木工程和医学三个领域的中英文双语术语对齐实验结果表明,该方法能够提高双语术语抽取的准确率.
    • 张乐乐; 郭军军; 王繁
    • 摘要: 从互联网可比语料中筛选高质量的平行句对,是提升低资源机器翻译性能的有效手段之一。针对该问题,融合预训练语义表征提出一种基于双向交互注意力机制的跨语言文本语义匹配方法,首先利用预训练语言模型分别获得源语言和目标语言的双语表征,其次基于双向交互注意力机制实现跨语言特征的空间语义对齐,最后基于多视角特征融合后的语义表征实现跨语言句对的关系判定。实验结果表明,所提方法优于已有的平行句对抽取模型。此外,借助抽取出的平行语料,机器翻译模型的性能得到了明显的改善。
    • 林鹭; 熊艳; 李勤政; 杨丹凤
    • 摘要: 目的针对设计过程中存在潜在的设计意图与用户实际感知不一致的问题,依据较为客观量化的实验结果,以设计者风格意图为基准,研究了不同背景被试者对产品的感知差异。方法采用语义差异法、眼动追踪技术和回顾性访谈,以家具座椅为实验样本,对42名被试者进行产品的语义匹配度实验。记录和分析被试者对产品特征的感知及意象决策过程的相关数据,对比不同背景用户的意象感知引起不同关注模式。结果一般来说,工业设计背景被试者对产品语意感知拥有更高的匹配度;当工业设计背景被试者相比于非工业设计背景被试者的语义匹配度低时,形态特征注视点具有差异;不同背景的被试者对于座椅形态在椅背和椅面均表现有更高的关注度。结论结果表明用户对产品特征的关注与意象感知相关,利用眼动技术能够较为客观地描述它们的关系。研究关于理解不同背景用户之间对产品的语义感知差异,辅助设计者有针对性操作设计特征,进行创新设计提供了一定支持。
    • 张志远
    • 摘要: 发布/订阅系统广泛应用于涉及消息发送和接收的业务,事件匹配算法是其中的关键问题。综述了基于内容和基于语义2类发布/订阅系统的事件匹配算法。对基于内容的发布/订阅系统中事件匹配算法进行了分类讨论,详细梳理了其索引结构的发展脉络,比较了各种算法的异同和优缺点。基于语义的发布/订阅系统具有更强的描述能力,简要介绍了其中的语义数据模型,详细对比了近年来提出的语义事件匹配算法,并对未来的研究方向进行了探讨和展望。
    • 李媛; 陈昭炯; 叶东毅
    • 摘要: 研究基于参考图像的花卉线稿图的工笔效果上色问题.现有的基于参考图像的线稿图上色算法对工笔花卉画特有的色彩渐变的特点难以学习和模拟;此外通常还要求参考图像与线稿图具有相似的几何布局结构,这也限制了算法的适用性,故而直接采用现有算法难以实现线稿图的工笔效果上色.基于条件生成对抗网(conditional generative adversarial network,CGAN)框架,提出了一种将参考图像与线稿图进行语义匹配的花卉线稿图工笔效果上色算法RBSM-CGAN.该算法在网络结构设计方面,以U型网络(简称U-Net)为生成器基础,设计了2个附加子模块:1)语义定位子模块.该模块预训练了一个语义分割网络,以生成花卉线稿图的语义标签图,该标签图编码后作为自适应实例归一化的仿射参数引入到上色模型中,提升对不同语义区域的识别能力,进而提高颜色定位的准确性.2)颜色编码子模块.该模块提取参考图像的颜色特征,而后将该特征拼接到生成网络解码层的前3层,利用这种方式将颜色信息注入上色模型,与语义定位模块相配合加强算法对渐变色的学习和模拟.另外,算法在网络训练方面改变传统的“工笔花卉原作-花卉线稿图”数据对的训练方式,通过打乱原作的几何结构等摄动操作生成原作摄动图,采用“原作摄动图-花卉线稿图”数据对进行网络训练,降低了模型对原作空间几何结构的依赖性,提升了算法的适用性.实验结果表明:该算法对用户选择的参考图像的颜色语义具有正确的响应,所引入的“语义定位+颜色编码”的结构设计提升了对渐变色的模拟效果,实现了在不同参考图像指导下的花卉线稿图的工笔效果上色,可快速生成多样化的上色结果.
    • 王文川; 朱全银; 孙纪舟; 马甲林
    • 摘要: 随着“十四五”规划提出要保护和激励国内产生更多高价值专利,各类跨学科、跨领域的创新型专利申请量激增,专利自动分类方法辅助人工分类的需求日益增长.目前,中文专利分类主要由审查员根据提交的专利内容,与国际专利分类体系表进行人工匹配来确定所属分类,人工效率低.已有的专利自动分类方法主要从专利中提取文本结构特征和语义特征,将两种特征与国际专利分类体系表中的标签直接进行相似度匹配,没有考虑到国际专利分类表中分类标签解释文本的语义信息,容易导致分类模糊.为此,提出一种基于语义匹配的多标签多层级中文专利分类方法,将传统的文本分类问题转化为基于语义特征的文本匹配问题,以实现专利文本多标签多层级分类任务.通过从国际专利分类表中提取各标签各层级(部、大类、小类、大组和小组)的语义特征,同时从公开专利中提取文本语义特征,并将二者进行语义匹配,从而达到自动分类的目的.在同一数据集上的实验结果显示,该方法能够取得更好的效果.
    • 赵元
    • 摘要: 常规方法匹配输入名词和翻译名词关联语义时,译文组合关联程度达不到最优,造成名词翻译召回率和准确率较低。提出基于机器辅助的高校英语专有名词自动翻译方法。预处理英语专有名词文件,建立英语平行语料库,为机器辅助提供语料,分割用户输入名词和语料库检索名词语义,根据关联系数和编辑距离,匹配语义关联的输入名词和检索名词,建立语义匹配评价体系,选取最优匹配译文组合作为翻译译文。采用英语专有名词实体集设置对比实验,结果表明,该方法提高了翻译召回率和准确率,以及两项指标调和均值,专有名词翻译结果更加准确。
    • 尚福华; 蒋毅文; 曹茂俊
    • 摘要: 语义匹配作为自然语言处理任务中重要的一环,直接制约问答系统、信息检索等任务的效率。针对现有语义模型大多只以词为基本语义单元进行注意力交互,较少考虑中文中的词边界模糊和字符信息获取不足而带来的语言颗粒度对整体建模忽略的问题,提出一种增强的多粒度特征融合语义匹配模型EMGFM。首先结合BERT模型和word2vec以获得增强的字符向量表示,然后从字、词、句三种粒度进行注意力的交互,并对交互结果进行加权融合,以突出不同交互信息对整体建模的贡献。为减少交互过程中产生的信息损失,通过构造差异性来对交互信息进行信息增强。最后通过最大池化、平均池化两种方式获得文本的最终语义表示以进行匹配度的计算。该模型在CCKS问句匹配大赛中文数据集上达到了87%的正确率,相比于一些语义匹配的经典模型准确率均有提升,证明该方法确实能有效提升问句语义匹配的准确性。
    • 李琳; 段围; 周栋; 袁景凌
    • 摘要: 法律条文(简称法条)是司法量刑的主要依据,法律条文的精准推荐,能够辅助提高法律智能判决的质量.目前,主流的法条推荐模型是将有限数量的法条当作类别标签,采用分类的思想,根据法律文书的案例描述将其归类到相关的法条.但是法条作为法律规范的文字表述形式,现有的分类方法简单将其作为类别标签的索引编号,导致对其语义信息利用不足,影响了推荐质量.针对此问题,研究将主流的法条推荐方法从分类模型转化为语义匹配模型,提出了基于深度语义匹配的法条推荐方法(DeepLawRec).该方法包含局部语义匹配模块和全局语义推荐模块,分别设计双向Transformer卷积网络模型和基于回归树的推荐模型,在理解文本序列的同时,关注与法条匹配学习相关的局部语义特征,增强法条推荐的准确率和可解释性.在公开数据集上的实验结果表明,DeepLawRec方法在推荐质量上优于传统的文本分类以及经典的语义匹配方法,并进一步探讨了如何分析和判读推荐结果.
    • 何春辉; 胡升泽; 张翀; 葛斌
    • 摘要: 中文句子对相似性计算任务旨在利用模型对两个句子的相似性进行判别,在文本挖掘领域有广泛的应用。考虑到现有机器学习方法不能同时兼顾句子对的深层语义特征和显式特征的问题,该文提出融合深层语义和显式特征的中文句子对相似性判别方法。采用BERT和全连接网络来获取深层语义向量,再拼接显式特征构造新的特征向量,最后通过分类器完成句子对的相似性判别。实验结果表明,该方法在3个公开的中文句子对相似性评测数据集上的性能均优于基线方法。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号