电子商务中针对产品的摘要挖掘技术研究
RESEARCH ON PRODUCT SUMMARY MINING IN ELECTRONIC COMMERCE
摘 要
Abstract
目 录
第1章 绪 论
1.1 课题背景及研究内容和意义
1.1.1课题背景
1.1.2 课题研究内容
1.1.3 课题研究意义
1.2 多文档文摘研究现状
1.2.1 多文档文摘主要方法
1.2.2 多文档文摘的自动评测
1.2.3 相关国际评测
1.3 本文组织结构
第2章 基于句子聚类的子主题生成研究
2.1 引言
2.1.1 子主题的定义
2.1.2 句子聚类形成子主题总体思路
2.2 句子聚类
2.2.1 特征表示
2.2.2 相似度计算方法
2.2.3 聚类方法
2.3子主题形成及重要性排序
2.4 本章小结
第3章 基于分类的摘要短语抽取研究
3.1最大熵模型介绍
3.1.1条件最大熵模型
3.1.2最大熵最优解
3.1.3模型训练算法
3.2 候选短语获取
3.2.1 指示词表的构建
3.2.2 候选短语获取方法
3.3 短语识别
3.4 短语打分与摘要生成
3.5 本章小结
第4章 产品摘要挖掘系统实现
4.1系统介绍
4.2 主要模块介绍
4.2.1文本预处理
4.2.2句子聚类形成子主题
4.2.3短语识别与抽取
4.3 本章小结
第5章 实验结果及分析
5.1 引言
5.2 短语识别实验
5.2.1 数据
5.2.2 评价指标
5.2.3实验结果与分析
5.3 摘要生成实验
5.3.1 数据资源
5.3.2 评价指标
5.3.3实验结果与分析
5.4 本章小结
结 论
参考文献
攻读硕士学位期间发表的论文及其它成果
哈尔滨工业大学硕士学位论文原创性声明
哈尔滨工业大学硕士学位论文使用授权书
致 谢