首页> 中文学位 >儿童语料库建设与幼儿词汇语义分类
【6h】

儿童语料库建设与幼儿词汇语义分类

代理获取

目录

文摘

英文文摘

声明

引言

第一章儿童口语研究及其语料库建设

第一节儿童口语研究的现状

第二节儿童语料库建设的现状

第二章儿童口语语料的采集与整理

第一节儿童口语语料库的体例

第二节儿童口语语料的采集

第三节儿童口语语料的整理

第三章儿童语料的自动分词与词性标注

第一节自动分词与校对流程

第二节自动分词校对的问题

第三节词性标注校对的问题

第四章幼儿普现词汇的提取与比较

第一节儿童语料的词频统计

第二节幼儿普现词汇的提取

第三节幼儿普现词汇的比较

第五章幼儿普现词汇的语义分类

第一节词汇语义分类的目的和方法

第二节幼儿普现词汇的语义分类框架

第三节幼儿普现词汇的语义分类结果

第四节儿童语料库的义类标注方案

结语

参考文献

附录

后记

展开▼

摘要

个体母语习得实际上表现为个体认知语义网络的建构过程,这一网络的内核在五岁以前逐步形成。为便于研究,可依据年龄段将五岁前儿童的语义网络划分为两岁、三岁、四岁、五岁等不同阶段。 作为儿童语义网络建构研究的基础性工作,本研究的主要任务是:1.五岁前儿童口语语料库的研制;2.幼儿(两岁和三岁儿童)语料的词频统计及普现词提取;3.幼儿普现词的语义分类;4.义类自动标注方案的制定及其在计算机上的实现。 第一步,采集儿童口语语料并转写为电子文本,进行自动分词和词性标注并辅以人工校对,先后建成含成人对话者语料的A库(113万字)和纯儿童语料的B库(30万字)。第二步,对B库中两岁和三岁儿童语料进行词频统计,通过与已有儿童词表的对比,提取出两岁儿童普现词(多种词表共现,在本语料库中频度较高或多个儿童使用的词)354个和三岁儿童普现词940个。第三步,基于11个语义大类(人类、事物、时空、行动、状态、属性、数量、限制、情态、功能、语助)的框架,对两岁与三岁儿童的普现词分别进行语义分类。第四步,制定语义词类(义类)自动标注方案,研制语义词类自动标注软件(贺胜老师研制),实现对两岁和三岁儿童语料的初步义类标注。 本研究坚持实地调查和文本采集、人工和机器、比较和分析的方法,研究的主要成果包括儿童口语语料库、幼儿普现词表以及幼儿词汇语义分类框架,其特色成果“语义词类自动标注软件”及“义类标注儿童语料库”属于原创,为儿童语言的语义语法和语义网络建构研究提供了必要工具并奠定了坚实基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号