词类标注
词类标注的相关文献在1995年到2022年内共计103篇,主要集中在汉语、常用外国语、语言学
等领域,其中期刊论文95篇、会议论文5篇、专利文献6283篇;相关期刊71种,包括鲁东大学学报(哲学社会科学版)、广东外语外贸大学学报、河南工程学院学报(社会科学版)等;
相关会议5种,包括中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)、第二届汉语中介语语料库建设与应用国际学术讨论会、中国辞书学会第六届中青年辞书工作者学术研讨会等;词类标注的相关文献由111位作者贡献,包括王仁强、董玉双、吴铭等。
词类标注
-研究学者
- 王仁强
- 董玉双
- 吴铭
- 宫妮
- 谭景春
- 刘伟权
- 华却才让
- 吴壮伟
- 姜文振
- 徐济铭
- 才让加
- 杨旭
- 玉素甫·艾白都拉
- 米尔夏提
- 艾孜尔古丽
- 邓娇
- 邬德平
- 郭凯莉
- 郭昭军
- 钟义信
- 陈敏
- 霍忠振
- 马永强
- Azragul
- Mirxat
- Yusup Abaydula
- 万众
- 代瑜
- 何滟秋
- 侯瑞芬
- 俞士汶
- 冯志伟
- 冯桂华
- 刘瑞恒
- 华沙宝
- 吉太加
- 吕凌云
- 吴晓松
- 吴铭1
- 周强
- 周春瑜
- 姜明宇
- 尹雪璐
- 崔文灿
- 巩遵成
- 张仰森
- 张建红
- 张芬芬
- 张苏亚
- 张蓝月
-
-
谭景春
-
-
摘要:
《现代汉语词典》第5版对双斜线“//”在使用上有两点改进,第6版、第7版一直沿用,没有改动。第一点改进是创建“(-//-)”符号;第二点改进是把可离合的主谓式双字条目分写的注音改为连写,并在中间加双斜线“//”。前者解决了如何处理一个条目中有的义项可离合、有的义项不可离合的问题,后者解决了如何处理词类标注和双斜线“//”的关系问题。
-
-
吴铭;
王仁强
-
-
摘要:
时间词的词类归属历来存在争议。本文调查了时间词在7部汉语/汉英词典中的词类标注后发现:(1)汉语/汉英词典中,时间词词类标注不一致率竟然高达三分之一;(2)不论汉语词典还是汉英词典,都倾向于将时间词标注为单类名词;(3)汉语词典间,时间词的词类标注未见显著差异,但在汉英词典间,差异显著(χ^(2)=25.022,p=.001<α=.05)。时间词的词类标注在汉语词典和汉英词典中之所以高度不一致,很大程度上是因为理论界对时间词的词类地位及范围众说纷纭。研究表明,时间词不是一个语法上的词类概念,理应在词类研究中摒弃;时间词不论被视为名词或副词的次类,还是独立的词类,实则都是科学主义的产物;只有基于大型语料库进行使用模式调查后才能更好地将与时间相关的概括词进行合理归类,进而提升汉语/汉外词典的编纂质量。
-
-
吕凌云;
邬德平
-
-
摘要:
在现代汉语语法本体研究和现代汉语词典词类标注研究中,兼类问题尤为棘手,且极具争议。基于双层词类范畴化理论,通过对北京大学中国语言学研究中心(CCL)语料库和北京语言大学语料库(BCC)的随机取样分析,我们发现“困惑”作为名词、动词和形容词的用法在个例频率、类型频率、历时分布和语域分布四个方面均满足规约化的用法,在词典中应被处理为名、动、形兼类词。研究表明,“困惑”一词的词类标注问题较多,让人困惑,其实是受科学主义方法论影响下的“简约原则”的束缚所致。
-
-
蒋铖;
胡丽珍
-
-
摘要:
《现代汉语词典》(第7版)将“以前、以后、以降、以来”四个表时间的词标注为方位词,而其在对方位词的概念进行界定时并未提及方位词可以表示时间。大量语言事实表明,这四个词并没有表示方位和处所的用法。所以,“以前”“以后”“以降”“以来”应当标注为时间词。而对于“之前、之后、前后、左右”等兼表方位和时间的词,《现代汉语词典》将它们标注为方位词也不恰当,应该按照不同的义项分别加以词类标注。因此,方位词标注的方法及原则便显得尤为重要。
-
-
董玉双
-
-
摘要:
文章以双层词类范畴化理论为指导,基于汉语/汉英词典和语料库分别对双音节词"斗争"的词类标注进行探讨.研究发现,汉语词典将"斗争"标为动词,少部分汉英词典将其标注为动名兼类词;且同部词典中存在配例、释义与词类标注不协调等问题.通过两大语料库检索得知,"斗争"名词用法使用频率高,用法广泛.《牛津高阶英语词典》(第9版)中"斗争"的对应词"struggle"被标注为动名兼类词.现代汉语词典在处理兼类问题时不同于现代英语词典的原因主要是汉语词类遵循"简约原则",但该原则在处理词类问题尤其是概括词的语法多功能现象上会出现偏差,并会导致词典微观结构表征的实践冲突.
-
-
张蓝月;
王仁强
-
-
摘要:
通过对权威汉语/汉外双语词典和国家语委现代汉语语料库的调查发现,"表扬/批评"的词类标注存在分歧,且未体现词类标注与释义/译义的对称性原则.文章在"双层词类范畴化理论"的指导下,基于CCL现代汉语语料库对"表扬/批评"的词类标注问题进行探讨.研究发现,概括词"表扬/批评"在现代汉语社群语言系统层面中属动名兼类词,并非仅是动词.
-
-
陈敏;
郭凯莉
-
-
摘要:
以"双层词类范畴化理论"为基础,基于国家语委现代汉语语料库、《现代汉语词典》(第6版)、《现代汉语词典》(第7版)、《现代汉语规范词典》(第3版)、《汉英词典》(第3版)和《新世纪汉英大词典》(第2版)词类标注数据,对"半夜"一词的词类标注问题进行实证研究,从而搞清楚"半夜"一词的词类归属,以期为汉语以及汉英词典编纂提供合理的建议.
-
-
陈敏;
郭凯莉
-
-
摘要:
以“双层词类范畴化理论”为基础,基于国家语委现代汉语语料库、《现代汉语词典》(第6版)、《现代汉语词典》(第7版)、《现代汉语规范词典》(第3版)、《汉英词典》(第3版)和《新世纪汉英大词典》(第2版)词类标注数据,对“半夜”一词的词类标注问题进行实证研究,从而搞清楚“半夜”一词的词类归属,以期为汉语以及汉英词典编纂提供合理的建议。
-
-
陶佳丽;
杨志伟;
崔文灿;
苏爽
-
-
摘要:
通过对几部具有代表性的大中型汉英词典的调查,发现汉英词典对“思维”的词类标注比较片面.鉴于此,本文采取语料库的研究方法,利用“语料库在线”,对“思维”一词在现代汉语中的使用进行了检索,并对检索结果加以分析,结果表明“思维”在汉英词典中应处理为名动兼类词.
-
-
-
-
-
冯志伟
- 《第二届汉语中介语语料库建设与应用国际学术讨论会》
| 2012年
-
摘要:
Leech在1997年的"Introducing corpus annotation"一文中给语料库标注(corpus annotation)下的定义是:"为电子口笔语语料库文本添加解释性信息和语言学信息的活动."标注的具体实施就是对文本某些元素或特征添加预定的标签(tag),语料库标注通常可以分为计算机自动标注、机助人工标注和完全人工标注3种.在实际运用中,标注这个术语有3个含义:第一个含义指标注方案,也就是一系列预定的标注代码集和标注规则集;第二个含义指标注过程,包括标注使用的软件、技术和程序;第三个含义指标注产品,也就是加工过的带标记的语料库文本.不同的研究者对标注这个术语的使用不完全相同.文中介绍了英语词类标注中的兼类词消歧策略、随机词类标注、基于转换的标注、英语词类标注中的其他问题,目前,基于语料库的研究范式仍然是语料库语言学研究的主流,应当关注语料库驱动研究范式提出的问题,注意克服语料库标注的局限性,比如在语料库标注中,应当特别注意语料库标注集的科学性和可靠性,尽量避免主观性和片面性,克服标注的局限,使语料库的标注尽可能地反映语言的真实面貌。在语料库标注中,由于标注集的不同往往会导致标注语料库之间无法进行数据交换和共享,影响了标注语料库的使用效果。因此,应当特别注意语料库标注集的标准化和规范化,进一步提高标注结果的共享程度。
-
-
-
-
-
-
-