语料库
语料库的相关文献在1984年到2022年内共计9139篇,主要集中在常用外国语、语言学、自动化技术、计算机技术
等领域,其中期刊论文8506篇、会议论文296篇、专利文献45852篇;相关期刊1878种,包括文教资料、考试周刊、解放军外国语学院学报等;
相关会议139种,包括第二届航空科技翻译学术交流会、第四届全国少数民族青年自然语言信息处理学术研讨会、第七届全国语言文字应用学术研讨会等;语料库的相关文献由9135位作者贡献,包括何安平、李仕春、亢世勇等。
语料库—发文量
专利文献>
论文:45852篇
占比:83.90%
总计:54654篇
语料库
-研究学者
- 何安平
- 李仕春
- 亢世勇
- 刘剑
- 陈建生
- 刘洋
- 孙海燕
- 高博
- 张黎黎
- 戈玲玲
- 李光赫
- 李慧
- 毛文伟
- 吴军莉
- 李广伟
- 程张根
- 胡开宝
- 任培红
- 刘芹
- 张仁霞
- 张敏
- 戴光荣
- 王静
- 邓飞
- 刘泽权
- 刘芳
- 吴志芳
- 张普
- 王敏
- 陈颖
- 黄昌宁
- 黄永新
- 刘萍
- 张小宁
- 戴宝玉
- 朱鹏霄
- 杨元媛
- 任小华
- 俞士汶
- 刘华
- 唐丽玲
- 张继东
- 曹琳
- 梁健丽
- 汪晓莉
- 王海峰
- 王琴
- 肖忠华
- 胡春雨
- 蒋春丽
-
-
曹庆香
-
-
摘要:
无灵主语搭配意识动词是英语中较为普遍的一种语法现象。本研究基于WECCL和LOCNESS语料库,对比分析中外大学生作文中无灵主语句的使用情况。研究结果表明,与英语本族语者相比,中国英语学习者存在无灵主语句使用数量较少且意识动词的使用较为单一的问题。
-
-
朱锦韵;
方颖
-
-
摘要:
选取2000—2020年中国知网收录的有关语料库与二语词汇习得的35篇国内期刊文献,从总体态势、研究工具、研究内容和研究方法四个层面概述研究趋势。结果显示:我国关于语料库与二语词汇习得的研究呈波动态势;此类研究所采用的研究工具以国内外知名现有语料库为主,自建语料库为辅;我国关于语料库与二语词汇习得研究主要以词语搭配及中介语研究为主;基于语料库的二语词汇习得研究方向可分为针对词汇的搭配形式与语义功能的研究、针对短语结构进行的词汇习得研究、从意念到表达形式的综合分析这三种。总体来看,我国语料库与二语词汇习得研究存在研究范围较窄,基于纵向语料库研究学习者二语词汇习得的方式单一等问题。最后,就未来语料库与二语词汇习得研究发展提出相关建议。
-
-
司炳月;
李一同;
吴美萱
-
-
摘要:
以2010年至2021年的《政府工作报告》原文及英译本为研究语料,将COCA语料库作为参照语料,对英译本中泛义动词“做好”及其搭配的翻译方法进行归类和历时研究。研究发现:政治文献英译本中的泛义动词主要采取四种不同的翻译方法,其中明晰化的翻译方法使用频率最高,动补化和省译次之,直译的使用频率最低;随着年份的推进,动补化、省译和直译的出现频次总体呈下降趋势,只有明晰化的翻译方法使用频率总体保持上升的趋势,说明译文呈现出不断“归化”的特点,可反映出政治文献译者的读者意识不断增强,注重表达的简洁性与地道性。基于语料库的词语搭配研究有助于提升中国政治文献的翻译质量,为今后的翻译相关研究提供一定的借鉴作用。
-
-
段冰霜
-
-
摘要:
在商务英语的教学体系结构中,英语翻译占有非常重要的地位。它是我们实现母语与外来语言之间交互的一种有效的方式。在展开商务英语翻译的相关教学活动之中,很多商务英语翻译课程教师把机读语料库作为英语翻译课堂教学的重要应用手段。本文以商务英语翻译教学为主要研究方向,以机读语料库为教学载体与平台,通过对机读语料库的多元化应用,提高学生在商务英语翻译课堂的活跃性,进而提升商务英语专业学生对英语翻译课堂的喜爱度,提升商务英语教师的综合教学能力。
-
-
吴进珍
-
-
摘要:
近年来,语料库对翻译研究起到了巨大的推动作用。针对《首组动词》中的一些翻译实例,借助于TED平行语料库能够解决英译汉中一词多义在翻译过程中存在的问题。研究证明:平行语料库可以提供大量语言实例,能明确词语所使用的语境,在一定程度上弥补了词典的不足。将平行语料库检索的实例与自建语料库的实例进行比对,可以快捷、有效地选用恰当义项进行翻译。
-
-
陈冬纯;
陈燕霞
-
-
摘要:
公共文化服务政策蕴含着一定的话语秩序和权力意志,具有指向性、动态性、过程性和引导性等特征。研究选取“十三五”期间中央及部委层面出台的公共文化服务政策文本作为研究对象,借助新一代语料库LancsBox中的Words、GraghColl、N-gram等功能进行政策文本的高频词、高频词丛和搭配网络等语言特征分析,从而考察政策文本的主要议题,并从批评话语分析视角阐释政策话语的建构逻辑以及背后隐藏的意识形态。研究旨在检验语言学理论在政策文本研究中的适用性,丰富了政策领域的研究视角,并拓宽研究的实证基础。
-
-
胡佳鑫
-
-
摘要:
近义词辨析一直是中学英语词汇教学的重点和难点,近义词意思相近但是在具体使用上却有细微的差别。学生在记忆相近意思的单词时,一般都会选择死记硬背或者一概而论,教师在教授近义词时也大多进行字面解释。而语料库可以为学习者提供大量真实的材料,这将为近义词的辨析和使用提供强大的数据支持。该文选取近义词acknowledge和admit,以BNC(英国当代语料库)为工具,从语域、搭配、语义韵等方面研究这一对近义词的搭配和使用,旨在为中国英语学习者提供学习近义词的方法,并为英语词汇教学带来启示。
-
-
展凯顺
-
-
摘要:
散文语篇具有形散神聚,意境深邃的特点以及灵活多样的表现手法,译者在英汉互译过程中需要考虑不同的翻译策略,针对英汉语言不同的表达习惯进行适当的增补删减或灵活地调整句式结构。从英汉语篇信息结构差异的视角考虑,以张培基的《英译中国现代散文选》为例,采用语料库数据分析的方法对英汉散文语篇组织中语言思维和语句结构进行对比分析,并观察所建语料库中的词簇频率,词汇密度及类型符之比,可以更好地了解文章写作词汇的丰富程度,以便更清楚地探究语句间的逻辑关系与句法特征。
-
-
陈柯尹;
张高远
-
-
摘要:
英语写作中,连词在语句衔接、篇章连贯和正确表情达意方面起着举足轻重的作用。英语连词while义项繁多、用法复杂,二语学习者容易出错。对于while等连词,仅宏观概述难以揭示其语用特征,对二语学习者启示有限。基于三个语料库的数据对比,运用AntConc 3.2.0和SPSS 25.0等统计工具,从逻辑含义、句法位置和类连接等角度,研究英语母语者对while的使用情况和中国大学生在该词使用上的偏误情况,发现后者对while的使用存在超量使用、欠额使用和误用等现象。这是由语际影响和语内干扰因素共同作用产生的。
-
-
张伟伟;
许涵
-
-
摘要:
分析中学英语语法教学存在的问题。概述基于语料库的数据驱动学习模式及语料库应用于语法教学的国内外已有研究。提出语料库数据驱动教学充分关注真实语境激发学习者学习的自主性和能动性。构建中学英语语法教学模式,并以过去分词教学为例,从需求分析、语料提取、观察引导、规则总结、巩固练习五个环节探讨该模式的具体操作,力图为语法教学提供新思路。
-
-
-
-
CAO Ziyan;
曹紫琰;
MAO Xuefen;
毛雪芬;
CHENG Ning;
程宁;
SONG Yang;
宋阳;
LI Bin;
李斌;
FENG Minxuan;
冯敏
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
产品评论文本是情感分析的重要研究对象,目前已有的产品评论语料库大都较为粗疏,没有完整地标注出对象、属性、极性“三要素”,影响自动分析的应用场景.对此,本文构建了细颗粒度情感语料库,共包含9343句汽车评论短文本,不仅人工标注了“三要素”的具体词语,而且将其对应到产品和属性的知识本体树上.此外,对无情感词的隐含表达、特殊文本(如建议文本、比较句等)也标注出对应的三元组并予以特殊标签.语料统计表明,对象和属性要素的共现率高达77.54%,验证了构建“三要素”齐全标注体系的必要性;基于本语料库的“三要素”自动标注实验F1值可达69.25%,验证了细颗粒度标注体系的可计算性以及语料库构建的规范性和应用价值.该语料库可以为细颗粒度情感分析研究提供基础数据.
-
-
ZHU Shucheng;
朱述承;
LIU Pengyuan;
刘鹏远;
SU Qi;
苏祺
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
性别偏见是社会学研究的热点.近年来,机器学习算法从数据中学到偏见使之得到更广泛的关注,但目前尚无基于语料库的方法对文本数据中职业性别偏见的研究.该文基于标记理论,利用BCC和DCC语料库,从共时和历时两个层面考察了63个职业的性别无意识偏见现象.首先,以调查问卷的形式调研了不同性别和不同年龄段的人群对63个职业的性别倾向,发现和BCC语料库中多领域的职业性别偏见度呈显著的正相关.然后从共时的角度,利用BCC语料库中不同领域的语料,以及DCC语料库中2018年全国31个省级行政单位(不含港澳台地区)的报纸语料,发现从口语至书面语语体,大部分职业表现出对女性的性别偏见逐渐升高,且不同地区对职业的性别偏见存在着差异.最后,从历时的角度,利用DCC语料库2005至2018年的报纸语料进行统计分析,发现职业性别无意识偏见现象随着时间的推移,呈现总体弱化趋势.
-
-
ZAN Hongying;
昝红英;
刘涛;
LIU Tao;
陈俊富;
CHEN Junfu;
LI Junzhuo;
李俊卓;
NIU Changyong;
牛
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
针对当前医学语料库涵盖实体分类以及实体关系难以满足精准医学发展需求的问题,本文从儿科疾病入手,参考现有的医学命名实体和实体关系标注体系,在医学领域专家的指导下,制定了适合儿科学的命名实体和实体关系的标注体系及详细标注规范;利用自行开发的标注工具,在采用机器学习进行预标注实体及实体关系后;以标注规范为指导,进行多轮人工标注,完成了298余万字的儿科医学文本中的实体及关系进行标注,形成了面向儿科疾病的实体及实体关系标注语料库.所构建的语料库包含504种儿科常见疾病,共标注命名实体23,603个,实体关系36,513个,多轮标注一致性分别为0.85和0.82.抽取已构建实体及关系标注语料库中的多元组,形成了儿科医学知识图谱,并开发了基于知识图谱的儿科医学知识问答系统.
-
-
- 《第十八届中国计算语言学大会暨中国中文信息学会2019学术年会》
| 2018年
-
摘要:
语言知识驱动计算机正确地处理自然语言,介词结构知识对自然语言处理和语言教学研究有很重要的意义.本文基于大规模语料库构建了高质量的介词结构搭配库.首先在前人研究的基础上对介词进行归类并建立了介词搭配知识体系,而后设计并实现了从大数据中获取介词结构搭配知识的规则,最后对抽取结果及其数据规模进行了统计和评估.主要目的是通过形式手段获取高质量的介词结构搭配,同时也为自然语言处理和语言学基础及应用研究提供数据支持.
-
-
-
邱冰;
皇甫伟;
朱庆之
- 《第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会》
| 2017年
-
摘要:
“古代汉语”是中国语言文学专业的核心课程,然而现有教材编撰在篇章选择、内容编排或知识点取舍上多基于主观经验,教学成效难以量化评估.基于先秦典型文献的词汇现象的频率、重要程度以及古今词义的差异,讨论了面向古代汉语教学的词汇知识点语料库的建设,提出了“古代汉语”教材预期成效的计算方法,并以王力主编《古代汉语》和王硕编著《汉语古文读本》两种性质不同、文选编排顺序不同的教材作为个案,对比分析了两部教材的篇幅、知识点分布和学习曲线,从量化数据上佐证了学界对两种不同性质教材的定性认识,同时也表明本文提出的教材预期成效评估方法的合理性.进一步讨论了文选的重新排序,获得了更加符合循序渐进教学过程的学习曲线.基于语料库的“古代汉语”教材预期成效评估方法不仅为教材评估提供了量化方法,也为成效导向教学在“古代汉语”课程的应用提供了探索性的思路和基础数据.
-
-
-
廖長彥;
張聰;
鄭年亨;
張菀真
- 《第22届全球华人计算机教育应用大会》
| 2018年
-
摘要:
想法产生在写作过程中扮演重要角色.透过自然语言技术来挖掘词汇间或句子间的语义关系,能推荐适合内容来引发学生产生想法.因此,本研究基于语料库的来发展小学中文写作推荐系统,并对其系统进行初步评估.本研究收集、分析、处理与建置具备58万篇写作文本的中小学语料库,并发展写作词汇与句子推荐机制,并邀请37名四年级学生参与评估.研究发现,学生对于提供的候选词汇或句子都有接近6成的认同度,但仍有近4成候选词汇或句子不适用;再者,学生对于系统有超过6成的正向态度.