基于文本挖掘的公共交通安全信息分类模型研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

当前，我国社会现在正处于快速发展和转型时期，迅猛发展的社会信息化和相对匮乏的警察资源，给公安情报部门的传统工作方法带来了前所未有的挑战。随着公安信息技术的不断进步，集中开发利用公安信息资源，构建完善的公安信息化体系，围绕“隋报信息主导警务工作”的总体构想，已成为推进公安工作现代化建设的一项重要战略任务。随着信息获取渠道的扩宽，使得公安人员能获取的信息量急剧增加，浪费了大量资源。本研究面向公共交通安全领域，针对其信息泛滥问题展开研究，试图通过机器学习方法找出上传信息中的无用信息，帮助公安情报研判人员筛去垃圾信息，降低所需甄别信息的数据量，辅助其维稳、反恐工作。首先，文献综述与相关理论部分，采用了文献分析法，阐述了公共安全及公共交通安全领域的研究现状;对文本挖掘及文本挖掘再公共安全领域的应用现状进行了分析;对本研究中设计的相关理论进行了归纳和总结。其次，数据预处理部分，本文通过Jieba中文分词对数据清洗后的原始文本进行了分词操作，同时再此步骤中设置了用户自定义词典，完成了停用词去除，对分词效果及分词粒度进行了优化;同时对分词结果进行了词性标注，并按照词性提取数据集，以达到降低特征维度，提高后续分类模型效率的作用。然后，构建模型部分，本文采用了有监督的机器学习方法。从完成上述预处理操作的数据集集中提取特征指标，再结合公安局自建词表，共得到3组特征词表，分别基于SVM分类算法与kNN分类算法进行分类模型构建，共得到5个有效模型，通过对其准确率的比较，最终选取了以BORUTA特征选择方法与SVM分类算法构建的分类模型作为本文的最终模型，该模型准确率达到81.25％，具有较好的分类性能和效果。最后，基于构建的分类模型，说明了实际应用时的操作流程，将分类模型引入“津门乘客”信息搜集平台，能有效的降低其无用信息的比例，减小情报人员的工作量，提高情报研判效率，同时为文本挖掘再公共交通安全领域的应用提供了参考。

著录项

作者
刘申冰;
展开▼
作者单位

天津师范大学;

展开▼
授予单位天津师范大学;
学科图书情报
授予学位硕士
导师姓名王世文;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类
关键词
文本挖掘; 交通安全; 信息分类;

相似文献

中文文献
外文文献
专利

1. 文本挖掘与中文文本挖掘模型研究 [J] . 谌志群 ,张国煊 . 情报科学 . 2007,第7期
2. 我国文献信息分类法研究进展分析——基于CNKI2000-2010年有关文献信息分类法研究论文的统计分析 [J] . 周阳 . 科技情报开发与经济 . 2012,第011期
3. 基于BERT-Att-biLSTM模型的医学信息分类研究 [J] . 於张闲 ,胡孔法 . 计算机时代 . 2020,第003期
4. 基于复合加权LDA模型的书目信息分类方法研究 [J] . 李湘东 ,丁丛 ,高凡 . 情报学报 . 2017,第004期
5. 基于 BIM 模型的工厂设备信息分类编码技术研究 [J] . 关俊涛 ,丁金听 ,杨建光 . 新技术新工艺 . 2016,第002期
6. 基于用户信息需求与获取视角的信息分类模型研究 [C] . Xiaobo ,肖博 ,DuanYao-qing . 2016年全国情报学博士生学术论坛 . 2016
7. 基于主题地图的城市空间信息分类和表达模型研究 [A] . 丁振川 . 2015

基于文本挖掘的公共交通安全信息分类模型研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅