汉语词法分析平台的构建

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着现代化信息技术的不断发展，计算机的数量快速增加，互联网内的信息量极速膨胀，计算机技术已经和人们的日常生活息息相关。自然语言处理是计算机科学领域一个重要的研究课题，它的研究对象是人们日常使用的语言，通过对自然语言的研究和处理，实现自然语言和计算机之间的互相理解和正常通信。
　　词法分析是自然语言处理领域一个重要的问题，大部分机器翻译的问题都需要进行词法分析。目前，对于词法分析的研究和实现大都局限在实验层次，而办公移动化、资源共享化的互联网环境决定了一个在线共享的实用性平台更具有现实意义。互联网上也已经出现了一些实用性的词法分析平台，能够实现基本的分词和词性标注的功能，但由于源码不可修改、词性标注集不同等原因，无法为今后的相关性研究工作提供支持。
　　本文在实验室研究的基础上，结合实验室的分词和词性标注源码，独立开发了一个词法分析的平台。在平台中，加入了人工干预的部分，用户可以对分词结果进行修正，系统会定时地启动线程对修正的结果扫描，找到修正结果中含有的新词用来扩充新词词典。对于每个用户，还可以申请临时词典，将需要使用的新词添加到临时词典中，暂时性地自定义分词结果。用户在提交分词请求的时候，可以选择原始分词、使用新词词典分词和使用临时词典分词等多种分词方式。词性标注方面，用户可以对句直接标注，也可以使用分词的结果进行标注，修正的词性标注的结果也可以为今后的标注效果的提高提供数据依据。
　　本文通过小概率事件置入的规则，弥补了统计方法上的局限性，使得统计和规则更好地融合，接口的公开化也方便了功能调用。平台中还加入了权限管理、工具下载和工作量统计等模块，后台服务器开发选用J2EE的SSM框架，数据库采用MySQL，服务器环境Ubuntu。

著录项

作者
叶子语;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科计算机技术
授予学位硕士
导师姓名黄德根;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
自然语言处理; 汉语; 词法分析; 词性标注;

相似文献

中文文献
外文文献
专利

1. 基于微信构建来华留学生汉语自主学习平台的研究与实践 [J] . 毛雷 ,徐宏桂 ,吴建国 . 轻纺工业与技术 . 2020,第006期
2. 基于微信构建来华留学生汉语自主学习平台的研究与实践 [J] . 毛雷 ,徐宏桂 ,吴建国 . 轻纺工业与技术 . 2020,第006期
3. "互联网+"时代校企合作实习平台构建研究——以汉语国际教育专业为例 [J] . 吴泓 ,曹然 . 黑龙江教育（理论与实践） . 2019,第012期
4. "互联网+"时代校企合作实习平台构建研究——以汉语国际教育专业为例 [J] . 吴泓 ,曹然 . 黑龙江教育：综合版 . 2019,第012期
5. 地方高校对外汉语网络教学平台构建研究——以义乌工商职业技术学院为例 [J] . 王惠莲 . 科教文汇 . 2017,第024期
6. 基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究 [C] . CHENG Ning ,程宁 ,LI Bin . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于语素的汉语词法分析方法研究 [A] . 王奇 . 2011

汉语词法分析平台的构建

目录

摘要

著录项

相似文献

相关主题

期刊订阅