基于关键句的K-means算法在热点发现领域的研究与应用

顾俊

首页> 中文期刊> 《贵州科学》 >基于关键句的K-means算法在热点发现领域的研究与应用

基于关键句的K-means算法在热点发现领域的研究与应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

由于“互联网+”提出的,网络信息呈现爆炸的趋势.面对海量数据如何准确找到热点事件成了网民关注的话题.文章从实际应用出发,首先对每一篇文本选取5句话作为该文本关键句,然后用TF-IDF计算特征词值,特征向量选择时不考虑单个字的权重,再用K-means算法进行聚类.以新浪新闻为例,将环境、住房和违法三类话题共322篇文本作为测试语料进行聚类,聚类准备率达到70％以上,说明选取关键句比将整个文本作为聚类对象的聚类效果好.

著录项

来源
《贵州科学》 |2016年第3期|93-96|共4页
作者
顾俊;
展开▼
作者单位

贵州师范大学数学与计算机科学学院,贵州贵阳550001;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理 ; 数据处理 ;
关键词
文本挖掘 ; TF-IDF ; 聚类 ; K-means ;

相似文献

中文文献
外文文献
专利

1. Spark平台上基于K-Means算法的热点路径发现方法研究 [J] . 崔艳超 ,周刚 . 信息工程大学学报 . 2016 ,第006期
2. 基于改进K-means算法的BBS热点话题发现 [J] . 马国栋 ,李慧 . 首都师范大学学报（自然科学版） . 2015 ,第004期
3. 基于改进K-MEANS算法的舆情热点自动发现 [J] . 黄美璇 . 中原工学院学报 . 2014 ,第006期
4. 基于K-means算法的轨迹数据热点挖掘算法 [J] . 徐文进 ,管克航 ,马越 . 计算机与现代化 . 2021 ,第010期
5. 基于改进K-means的网络舆情热点事件发现技术 [J] . 孙玲芳 ,周加波 ,徐会 . 计算机与现代化 . 2014 ,第004期
6. 北京市科技创新活动热点领域研究——基于科技查新项目学科领域统计分析 [C] . 张炜 ,陈深井 ,肖雯 . 北京科学技术情报学会2014年学术年会 . 2012
7. 基于关键句选择与有效文档选择的突发性热点话题发现 [A] . 顾俊 . 2017

基于关键句的K-means算法在热点发现领域的研究与应用

摘要

著录项

相似文献

相关主题

期刊订阅