您现在的位置: 首页> 研究主题> 跨语言

跨语言

跨语言的相关文献在1989年到2023年内共计484篇,主要集中在自动化技术、计算机技术、语言学、常用外国语 等领域,其中期刊论文174篇、会议论文4篇、专利文献11264篇;相关期刊153种,包括对外传播、现代情报、现代图书情报技术等; 相关会议4种,包括“中国文学海外传播”国际学术研讨会、中国图书馆学会医院图书馆委员会第14届学术研讨会暨06年年会、全国第八届计算语言学联合学术会议等;跨语言的相关文献由965位作者贡献,包括黄名选、余正涛、黄于欣等。

跨语言—发文量

期刊论文>

论文:174 占比:1.52%

会议论文>

论文:4 占比:0.03%

专利文献>

论文:11264 占比:98.44%

总计:11442篇

跨语言—发文趋势图

跨语言

-研究学者

  • 黄名选
  • 余正涛
  • 黄于欣
  • 高盛祥
  • 王海峰
  • 吴华
  • 线岩团
  • 程国艮
  • 许静芳
  • 相艳
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 徐玮琳
    • 摘要: 程度副词"很"的补语用法始于明代,清代以后使用频率逐渐增加.程度补语"很"的产生一方面是语义虚化的结果,另一方面受到语用和认知的影响,体现了焦点居后原则和情感域到程度域的转化.现代汉语方言中,形式上,组合式程度补语"得很"比粘合式程度补语"很"更具优势;意义上,有些方言中粘合式程度补语比组合式程度补语所表达的程度更高,相当于"太""厉害".跨语言考察中,粘合式程度补语比组合式程度补语更具优势,独龙语、哈尼语、彝语、藏语有补语居于述语之前的用法,说明补语位置的选择和基本语序有关,SVO结构的语言倾向于选择补语居后的表达,SOV的语言可以选择状语居前的表达.
    • 陈潇; 王晶晶; 李寿山; 韦思义; 张啸宇; 陈强
    • 摘要: 属性级情感分类是情感分析领域中一个细粒度的情感分类任务,旨在判断文本中针对某个属性的情感极性。现有的属性级情感分类方法大多是使用同一种语言的标注文本进行模型的训练与测试,而现实中很多语言的标注文本规模并不足以训练一个高性能的模型,因此跨语言属性级情感分类是一个亟待解决的问题。跨语言属性级情感分类是指利用源语言文本的语义和情感信息对目标语言文本中包含的属性级情感进行挖掘和分类,相对于单语言的属性级情感分类任务而言,它具有更高的挑战性。该文提出了一个基于多通道BERT的跨语言属性级情感分类方法(Multi-BERT),该方法使用不同的BERT模型分别学习源语言文本和目标语言文本的语义特征,适应源语言和目标语言的语法特点,然后将多个BERT模型学习到的文本表示彼此交互,可以从中挖掘出更充分的属性级情感信息,提高跨语言属性级情感分类的性能。
    • 刘高军; 刘思睿; 鲁朝阳; 王昊
    • 摘要: 语言学家认为,义原是人类语言的最小语义表示单位,词语的任何含义都可以通过义原间组合表达。目前,义原资源已应用于多种自然语言处理的下游任务中并取得不错的效果。现有义原资源主要以中文词语为主,同时少部分英文词语也有义原标注,但在其他语言中尚未普及。目前,已有部分研究者提出了自动化的跨语言义原预测方法,一定程度上实现为其他语言的目标词汇自动标注义原的能力。
    • 管子键; 吴旭; 颉夏青; 孙利娟
    • 摘要: 为解决领域小语种知识匮乏和不完备的问题,更好地进行网络空间内容治理,提出一种基于语义层次建模的跨语言知识单元迁移方法(SHACUT),知识模型借助多语言丰富知识库将知识图谱嵌入极坐标系,显式体现不同知识的语义层次结构,迁移模型借助对齐种子库对不同语言向量空间进行线性转换及置信度计算,实现对图谱中知识单元对齐和迁移。分别在公开通用语言数据集和领域小语种数据集上进行了跨语言知识单元迁移的仿真验证,实验表明SHACUT不仅能够对公开通用语言数据集进行有效的跨语言迁移,也在领域小语种数据集上取得不错的效果,相比baseline能够更好地对知识图谱语义层次进行建模,实现跨语言知识单元迁移。
    • 李国繁; 张峰; 刘聪
    • 摘要: 近年来,随着不同编程语言代码自动转换工具的出现,跨语言的代码抄袭检测问题受到了越来越多的关注.现有跨语言代码抄袭检测主要包括传统的基于中间特征的检测方法和近年来出现的基于机器学习的检测方法,后者在检测模型训练完成之后具有更好的检测速度,是当前跨语言代码抄袭检测的研究热点.然而,现有的基于机器学习的跨语言抄袭检测方法大多将代码作为文本来处理,未考虑代码的结构特征.结合代码基于抽象语法树的结构特征,本文提出了一个基于伪孪生神经网络框架的跨语言抄袭检测工具CLPDetector.该工具将训练数据中的源代码对转换成对应的抽象语法树,基于抽象语法树生成代码的向量表示,然后将结合BiLSTM、CNN和Attention的深度神经网络嵌入到伪孪生网络架构中训练抄袭检测模型,从而实现了跨语言代码抄袭的检测.为了提高检测精度,首先,在训练检测模型前,利用基于抽象语法树的skip-gram算法对词向量进行了预训练,并基于程序依赖图删除了训练数据集代码中的冗余代码.其次,在代码抄袭检测阶段,提出了一个基于属性计数的过滤器,用以排除不可能抄袭的代码对,提高检测效率.实验中基于一个开源的数据集,以Java代码和Python代码为例对CLPDetector的检测效果进行了验证.结果表明,在精确率和F1值方面,CLPDetector比基于属性计数的工具CLCDSA分别高7%和3%,比单纯使用BiLSTM的检测工具ASTLeaner分别高10%和8%.
    • 程晨静
    • 摘要: 三音节比况助词“也似的”具有相似义、比拟义和焦点语义,主要用来描述人对某种动作的情感或者心理状态,同时也具有凸显信息、强化语气等焦点语义;“也似的”可以和表示意外或者反预期的副词共现,表达说话人对另一方的情感,具有一定的褒贬色彩;分析“也似的”在方言中的运用,可知“也似的”具有一定的跨语言普遍性,隐喻、语义虚化、组块化、语用原因以及语言接触是其词汇化的主要动因。[1]
    • 邓亮; 杨坤
    • 摘要: 词汇类型学是20世纪90年代逐渐兴起的一种语言类型学研究新方法,其目标是揭示相同概念在词汇层面的共性与类型特征。本文结合已有研究对词汇类型学的主要研究路径与研究方法进行梳理,扼要介绍了称名学、符意学和词汇-语法界面三条研究路径,然后结合相关案例阐明了解构语义分析、行为语义分析、组合语义分析、认知语义分析和多语言视图分析这五种研究方法,研究有望为未来词汇类型学研究提供研究视角和方法论的参考与借鉴。
    • 王晨
    • 摘要: 本文基于英语、日语、汉语中方位系统表达手段的异同,探究生成语法空间句法模型在三种语言中的体现。本文提出方位系统应包含五个基本要素:基点、方向、位置、距离、路径,且这些要素基本按照一定次序在句法结构中向上投射。但不同类型的介词受到自身语义内涵和语法功能的影响,插入的位置和最高落点呈现出语言内和跨语言两个层面的差异,这些共同构成了方位系统多变的句法表现。
    • 刘建伟; 高悦
    • 摘要: 单词嵌入表示学习是自然语言处理(NLP)中最基本但又很重要的研究内容,是所有后续高级语言处理任务的基础.早期的单词独热表示忽略了单词的语义信息,在应用中常常会遇到数据稀疏的问题,后来随着神经语言模型(NLM)的提出,单词被表示为低维实向量,有效地解决了数据稀疏的问题.单词级的嵌入表示是最初的基于神经网络语言模型的输入表示形式,后来人们又从不同角度出发,提出了诸多变种.本文从模型涉及到的语种数的角度出发,将单词嵌入表示模型分为单语言单词嵌入表示模型和跨语言单词嵌入表示模型两大类.在单语言中,根据模型输入的颗粒度又将模型分为字符级、单词级、短语级及以上的单词嵌入表示模型,不同颗粒度级别的模型的应用场景不同,各有千秋.再将这些模型按照是否考虑上下文信息再次分类,单词嵌入表示还经常与其它场景的模型结合,引入其他模态或关联信息帮助学习单词嵌入表示,提高模型的表现性能,故本文也列举了一些单词嵌入表示模型和其它领域模型的联合应用.通过对上述模型进行研究,将每个模型的特点进行总结和比较,在文章最后给出了未来单词嵌入表示的研究方向和展望.
    • 郭新新
    • 摘要: 汉语中的动补结构由于其语义复杂性和结构多样性备受学界关注。在研究内容上,相关研究从配价语法、转换生成语法、构式语法、心智哲学、系统功能语言学、类型学等方面展开;在研究方法上,从历时和共时的角度对动补结构进行研究。文章从类型学的角度对已有动补结构研究进行综述,发现动补结构研究的跨语言、跨学科趋势,并且结合语言习得和技术运用进行动补结构的跨语言对比述评,对汉语动补结构的发展具有重要意义。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号