首页> 中文学位 >基于支持向量机的短信联系人关系判定方法研究
【6h】

基于支持向量机的短信联系人关系判定方法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 课题研究的背景

1.2 国内外研究现状

1.3研究的意义、内容和目标

2短信文本的预处理

2.1 短信文本的分词

2.2 分词结果中的停用词去除

2.3 本章小结

3短信文本特征向量的提取

3.1 短信文本表示方法的选择

3.2 短信文本特征向量的设计

3.3 短信文本特征向量中各分量权重的赋值

3.4 本章小结

4 基于SVM分类的联系人关系判定方法

4.1联系人关系划分

4.2基于SVM的短信联系人关系判定思路

4.3支持向量机中分类模型的构造

4.4 基于SVM的短信联系人关系判定算法

4.5 本章小结

5 实验和结果分析

5.1 实验环境和实验数据

5.2 实验结果评价指标

5.3 实验过程及结果分析

5.4 与KNN方法的对比

5.5 本章小结

6 结束语

6.1已完成的工作

6.2 下一步的工作

致谢

参考文献

展开▼

摘要

短信是人们日常生活工作中常用的一种通信工具,通过对其内容的分析获得联系人之间在现实生活中可能存在的关系,有助于短信数据的再应用。目前针对短信联系人关系判定的研究工作较少,但是该项研究工作具有很重要的理论和现实意义,因此有必要对其展开深入的研究工作。
  考虑到中文短信的非规范化和非结构化,在对常见的文本分词方法进行介绍和分析的基础上,基于短信文本的特征,选择了恰当的分词方法对短信进行分词操作,同时考虑到分词结果中可能存在的无意义的停用词,使用了《哈工大停用词表》对分词结果中的停用词进行了去除操作。
  直接使用分词的结果难以直接进行短信联系人的关系判定,为此需要选择恰当的文本表示方法对其进行抽象和建模,以利于后续分析。在对传统文本表示方法进行分析的基础上,选择了向量空间模型进行短信文本的表示,并根据短信的特点,设计了满足需要的短信文本特征向量,同时也讨论了特征向量中各分量权值的赋予方法,为后续联系人关系判定工作提供了数据基础。
  从分类工作的需要出发,定义了联系人之间可能存在的关系类别,考虑到难以在短信向量空间中为每类关系给予明确的特征模式,选择了分类的方式进行关系判定。在对主流的分类方法进行讨论和分析的基础上,选择了支持向量机的方法,围绕短信联系人关系判定的需要,采用了支持向量机(Support Vector Machine, SVM)决策树模型来构造多分类向量机,并选择了恰当的核函数实现了非线性分类,以此为基础,最终给出了短信联系人的关系分类判定算法。
  最后设计了相应的实验方案以及相应的实验评价指标,进行了短信联系人关系的判定实验,实验结果表明基于向量空间的短信联系人关系判定方法是有效的,通过对比实验表明基于SVM的方法在判定准确率上有所改善。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号