文摘
英文文摘
声明
第一章绪论
1.1引言
1.2自然语言理解概述
1.3中文自动分词
1.3.1中文自动分词在中文自然语言处理中的作用
1.3.2中文自动分词面临的难题
1.4未登录词的研究概述
1.4.1未登录词识别的现实意义
1.4.2未登录词识别的研究现状
1.5本文主要工作
第二章领域汉语理解中的智能分词模型的建立
2.1基于系统论的智能分词模型的提出
2.1.1传统分词方法的研究与分析
2.1.2基于系统论的智能分词模型的提出
2.2基于系统论的智能分词模型的设计和实现
2.2.1智能分词模型的核心设计思想
2.2.2智能分词模型的建立
2.2.3智能分词模型的模块分析
2.3本章小结
第三章未登录词处理模块
3.1未登录词概述
3.2未登录词处理模块概述
3.2.1基于领域的未登录词概述
3.2.2领域分词词典的设计
3.3领域数词短语和非汉字符号处理方法
3.3.1数词短语和非汉语符号的识别
3.3.2数词短语的识别方案流程
3.4中文未登录名词短语
3.4.1识别中文未登录名词短语的意义
3.4.2中文未登录名词短语识别的解决方案
3.4.3识别中文未登录名词短语的识别难点
3.5本章小结
第四章 中文未登录名词短语的识别
4.1问题研究的背景和实现意义
4.2规则与统计相结合的算法识别中文人名
4.2.1姓氏人名用字分析
4.2.2真实语料中识别中文姓名的上下文规则
4.2.3统计与规则相结合算法的提出
4.2.4潜在姓名汉字串的频率统计
4.2.5中文人名自动识别的基本步骤
4.2.6识别人名的关键步骤和主要流程
4.2.7测试结果分析
4.3基于模板匹配的机构名识别
4.3.1引言
4.3.2机构名的组成分析
4.3.3机构名的识别
4.3.4机构名各组成部分的识别
4.3.5机构名的识别流程
4.3.6机构名的边界条件
4.3.7实验结果及分析
4.4本章小结
第五章智能分词在产品设计中的应用
5.1产品设计中的领域汉语理解
5.2领域汉语理解中智能分词和未登录词识别模型的建立
5.3智能分词和未登录词识别模型在产品设计中的实际应用
5.4本章小结
第六章结束语
致谢
参考文献