新闻数据的分类方法与价值预测的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网的发展和普及，网络已经走进千家万户，人们获取新闻资讯的方式逐渐的由传统的报纸、广播、电视等方式向互联网媒体转变。可是面对海量的数据资源，人们往往难以从中筛选出对自己有价值的信息，而且这些庞大的信息如何有效的整合和管理也是个问题。所以为了有效的整合网络新闻资源，以及方便用户简洁而又全面的阅读体验，本系统中设计了一套完整的包含新闻爬取、关联分析、分类以及价值预测的新闻分析系统。主要工作包含以下几个方面：
　　1、在新闻相似性检测方面，实现了基于 TF-IDF特征提取和夹角余弦相似计算的新闻相似性度量，通过计算找出内容相似的新闻，根据相似新闻之间的关联关系发现新闻话题，以及根据新闻的发布时间，找出话题的源头等功能。
　　2、在新闻的重复性检测方面，提出了一种基于MinEDD度量的新闻重复性度量方法。为了过滤标记重复新闻，改善用户阅读体验，本系统中还在相似计算的基础上进行新闻的重复性检测。该方法是受传统编辑距离算法的启发而来，在新闻的重复性检测中能够保证更高的检测准确率。
　　3、在新闻分类方面，本文中系统的分析了常用的多分类组合策略的优劣势，结合本项目的特点，提出并实现了一种基于特殊结构的二叉树支持向量机多分类算法BT-ED-SVM的新闻文本自动分类系统。
　　4、在新闻的价值预测方面，结合新闻价值的要素，设计了一套通过百度新闻搜索平台提取与新闻价值相关的特征，并编写定时器自动采集时间序列数据，应用BP神经网络进行预测的新闻价值预测系统。
　　5、基于上述的算法和功能点，实现了一个互联网新闻的分析服务与管理系统。
　　通过该系统能够实现网络新闻的自动增量采集、相似性和重复性检测、分类以及价值预测等功能，能够有效的将互联网新闻资讯进行整合、提高信息使用效率，该平台具有广泛的应用前景和商业价值。目前该系统已经上线运行，已有50万终端用户。

著录项

作者
杜小清;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科软件工程
授予学位硕士
导师姓名陈峥;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类文字信息处理;新闻工作自动化、网络化;
关键词
网络新闻; 管理系统; 文本分类; 价值预测; 相似性检测;

相似文献

中文文献
外文文献
专利

1. 技术滥觞与新闻价值:媒体融合背景下数据新闻的伦理边界及内核建构——基于三家数据新闻栏目的实证分析 [J] . 巨高飞 . 东南传播 . 2021,第004期
2. 4种数据挖掘典型分类方法在股票预测中的性能分析 [J] . 张文俊 ,张永进 . 安徽工业大学学报（自然科学版） . 2017,第001期
3. 用数据传递独特新闻价值——新华网数据新闻生产的特征及启示 [J] . 王哲平 ,高雪峰 . 浙江工业大学学报(社会科学版) . 2017,第004期
4. 让数据说话，提升新闻价值--人民网数据新闻发展综述 [J] . 唐述权 . 传媒 . 2016,第014期
5. 大数据时代网络教育学习成绩预测的研究与实现--以本科公共课程统考英语为例 [J] . 孙力 ,程玉霞 . 开放教育研究 . 2015,第003期
6. 什么在影响新闻价值:互联网时代的新闻价值与社会情绪——"医生蹲地喝葡萄糖刷爆朋友圈"事件背后的新闻价值再思考 [C] . 严康 . 安徽省第八届新闻传播学科研究生论坛 . 2016
7. 基于特征分析和数据降维的复杂数据预测与分类方法研究 [A] . 邵臻 . 2015

新闻数据的分类方法与价值预测的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅