中文信息处理中若干技术的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着Intenet迅猛发展，各种资源不断增多。为了快速、高效的查找信息，信息处理以成为当前重要的研究领域。针对信息处理涉及的内容，本文对中文信息处理中的若干关键技术进行了研究，主要研究内容和贡献如下：实现了一种基于句法词典的句法分析方法。通过把文法规则映射为特征词，把句法分析转换为利用特征词生成句法判定树，使概率方法和规则方法有效的结合在一起。在封闭的测试中，该方法获得了89.40％的查全率，87.13％的查准率。提出了一种利用样本距离，改进K-means聚类的方法，有效地避免了初始点的选择所带来的误差，以及噪声和孤立点的影响。介绍了一种把多种语料库存入字典结构，以及使用此字典结构的方法；对特征词，使用多层hash存储，结合最大向前匹配，实现了快速分词算法，1G内存下，分词速度到2M/S；在实现基于隐马尔可夫模型的词性标注同时，结合平滑算法，标注正确率达到86％，排歧正确率达到82％；在实现基于KNN分类算法中，使用CHI统计方法选取属于该类的特征词，同时把该类的文档加载到其后，解决了信息冗余问题：通过利用句子的特性，计算句子在文本中的权重，简单实现了基于统计的机械自动文摘；通过采用向量空间模型，对输入语句进行同义词扩展，对文档采用倒排结构存储，实现了一个简单的信息检索。

著录项

作者
罗丽俊;
展开▼
作者单位

辽宁科技大学;

展开▼
授予单位辽宁科技大学;
学科计算机应用技术
授予学位硕士
导师姓名战学刚;
年度 2008
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;
关键词
信息处理; 语料库; 句法判定树; 中文信息;

相似文献

中文文献
外文文献
专利

1. 论中文信息处理中若干关键技术 [J] . 郭淑妮 . 数字技术与应用 . 2015,第007期
2. 论中文信息处理中若干关键技术 [J] . 郭淑妮 . 数字技术与应用 . 2015,第007期
3. 基于.NET平台的毕业设计管理系统中若干关键技术的研究与实现 [J] . 赵生翼 . 信息通信 . 2008,第003期
4. 区域性网络化制造中若干关键技术的研究与实现 [J] . 井浩 ,张璟 ,李军怀 . 西安理工大学学报 . 2006,第003期
5. 《中文信息处理若干重要问题》 [J] . 徐波 ,孙茂松 ,靳光瑾 . 中文信息学报 . 2004,第4期
6. 中文信息处理技术和成果在对外汉语教学中应用初探 [C] . 张俊萍 ,冯志伟 . 第五届国际汉语教学学术研讨会 . 2006
7. 中文信息处理中若干关键技术的研究 [A] . 王建会 . 2004

中文信息处理中若干技术的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅