首页> 中文学位 >用ELAN自建汉语方言多媒体语料库及其应用研究——以双峰方言语气词的研究为例
【6h】

用ELAN自建汉语方言多媒体语料库及其应用研究——以双峰方言语气词的研究为例

代理获取

目录

摘要

第一章 绪论

第一节 ELAN简介及本人相关研究成果

一、ELAN简介

二、本人的相关研究成果

第二节 研究对象、方法及意义

一、研究对象

二、研究方法

三、研究意义

第三节 双峰方言研究综述

第四节 语料来源、发音人、符号体例及音系

一、语料来源

二、主要发音合作人情况

三、符号体例说明

第二章 语料库与多媒体语料库

第一节 语料库

一、语料库的定义

二、语料库的分类

三、语料库的设计与加工

第二节 多媒体语料库

一、多媒体语料库的定义

二、世界各国多媒体语料库相关项目一览

第三节 汉语方言语料库建设情况概述

一、现代汉语方言音库

二、北京口语语料查询系统

三、温州口语语言资料库

四、香港二十世纪中期粤语语料库

五、汉语方言字音词汇数据库(日本)

六、东方语言学网站方言字音及方言词查询

七、拓展台湾数位典藏项目中部分方言语料库项目

八、地方普通话语音语料库

九、中国语言有声资源数据库(汉语方言部分)

本章小结

第三章 用ELAN自建汉语方言多媒体语料库

第一节 语音及视频的录制

第二节 ELAN的操作和使用

一、下载与安装ELAN

二、ELAN的功能设置

三、ELAN的几个基本概念和操作模式

四、ELAN建库操作的基本步骤

第三节 ELAN功能的拓展与开发

一、音频自动断句辅助工具Eaf Converter

二、批量Eaf文件转换工具

三、实验语音软件Praat在ELAN中的调用

本章小结

第四章 语料的分词、词性标注及相关统计

第一节 语料库语料分布情况统计

第二节 分词、词性标注及分类统计

第三节 语料库句子相关统计

第四节 语料库字频统计

本章小结

第五章 基于语料库的双峰方言语气词研究

引言

第一节 语气、语气表达手段、语气词

一、语气

二、语气表达手段

三、语气词

第二节 双峰方言语气词在语料库的考察

一、单用语气词

二、单用语气词小结

三、双峰方言语气词的连用

四、自建语料库中语气成分的共现

第三节 部分语气词的实验分折

一、语气词“呢”的实验语音考察

二、句末疑问语气词“咩”与“怕”实验语音考察

本章小结

第六章 结语

第一节 本文的主要研究工作

一、主要研究内容

二、主要创新之处

第二节 本文的不足及下一步研究工作

一、本文的不足

二、下一步研究工作

参考文献

附录一 ELAN操作常用术语中英文对照表(本人译)

附录二 双峰(花门)方言音系

附录三 篇章转写

附录四 在ELAN技术论坛上的讨论抓图

附录五 攻读学位期间主要科研成果

附录六 攻读学位期间主持和参与的主要课题

后记

声明

展开▼

摘要

ELAN是由荷兰内梅亨马普心理语言学研究所开发的一个跨平台的多媒体转写标注软件。本文详细介绍了利用ELAN自建汉语方言多媒体语料库的流程与方法。并以双峰方言语气词为例,论述如何基于这个自建的语料库进行相关研究。
   全文共分为七个部分。
   第一章绪论。首先对ELAN功能、特点及在各国的应用情况进行简单的介绍。本章还介绍了使用ELAN自建多媒体语料库的优势及从2011年以来本人研究ELAN所取得的一些相关成果。本章还谈到本研究的对象、方法、意义、双峰方言的研究综述及语料来源、主要发音人情况等内容。
   第二章语料库与多媒体语料库。语料库的概念在不同的著作和论文中不尽相同,本章首先界定了语料库的概念,接着谈到语料库的设计和加工。多媒体语料库是近年出现的一种新的语料库。在第二节中对多媒体语料库的内涵与外延进行了界定,还介绍了世界各国多媒体语料库的一些建设情况。本章花了相当笔墨介绍汉语方言语料库的建设情况。
   第三章用ELAN自建汉语方言单点多媒体语料库。语料库的建设是本文研究的重点之一。本章详细介绍ELAN的操作及使用以及如何使用ELAN建设方言多媒体语料库,以及如何分别建立语料总库和以各个发音的人语料子库。并介绍如何利用ELAN强大的检索功能对语料库中进行关键词、词语搭配、同现的检索。ELAN的开放性数据结构和设计,为我们拓展开发其功能提供了可能。为了提高ELAN音频转写的效率,提高语料处理和转换的速度,我们开发了两个ELAN的辅助增效软件,音频自动断句辅助工具及批量Eaf文件转换工具,在这里也简单地介绍了这两个软件的使用,另外还介绍了如何在ELAN中调用实验语音软件Praat。
   第四章语料的分词、词性标注及相关统计。首先介绍语料库语料来源与分布情况。ELAN在分词及词性标注等方面存在一定的不足,但ELAN能输出文本文件的功能,让我们可以借助第三方的语料库处理软件来进行这方面的处理,我们使用南京师范大学贺胜开发的CIPP中文语料库加工及应用工具,在自定义双峰方言用户词典的基础上,对所有语料进行了分词和词性标注,并以此基础为进行了句频、词频、字频的相关统计和分析。
   第五章基于语料库的双峰方言语气词研究。利用CIPP分词和词性标记功能,再结合ELAN中的检索功能。我们穷尽式地查找出所有含语气词的句子,从中总共提取了单用的语气词19个、双连的25组、三连的5组。然后在语境中逐个考察语气词单用、连用(双连、三连)时的语气意义和语气功能。最后在ELAN中调用实验语音软件Praat对“呢”、“咩”、“怕”等语气词在句中的语调进行简单的实验语音分析。
   第六章结语。本文的主要研究小结、本文存在的不足及下一步研究工作的计划与安排。
   附录部分有ELAN操作常用术语中英文对照表、双峰(花门)方言音系、篇章转写等内容。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号