基于向量空间模型的文本过滤系统

黄萱菁; 夏迎炬; 吴立德

首页> 中文期刊> 《软件学报》 >基于向量空间模型的文本过滤系统

基于向量空间模型的文本过滤系统

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本过滤是指从大量的文本数据流中寻找满足特定用户需求的文本的过程.首先从任务、测试主题、语料库和评测指标等方面介绍了文本检索领域最权威的国际评测会议--文本检索会议(TREC)及其中的文本过滤项目,然后详细地描述了基于向量空间模型的文本过滤系统.该系统由训练和自适应过滤两个阶段组成.在训练阶段,通过特征抽取和伪反馈建立初始的过滤模板,并设置初始阈值;在过滤阶段,则根据用户的反馈信息自适应地调整模板和阈值.该系统参加了2000年举行的第9次文本检索会议的评测,取得了很好的成绩,在来自多个国家的15个系统中名列前茅,其中自适应过滤和批过滤的平均准确率分别为26.5%和31.7%.

著录项

来源
《软件学报》 |2003年第3期|435-442|共8页
作者
黄萱菁; 夏迎炬; 吴立德;
展开▼
作者单位

复旦大学计算机科学与工程系;

上海;

200433;

复旦大学计算机科学与工程系;

上海;

200433;

复旦大学计算机科学与工程系;

上海;

200433;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
文本检索; 文本过滤; 文本分类; 机器学习; 向量空间模型;

相似文献

中文文献
外文文献
专利

1. 基于N层向量空间模型和两重过滤方法的文本过滤系统的研究 [J] . 刘红芝 . 科技信息 . 2009,第032期
2. 基于向量空间模型的维吾尔文文本过滤方法 [J] . 亚力青·阿里玛斯 ,哈力旦·阿布都热依木 ,陈洋 . 新疆大学学报（自然科学版） . 2015,第002期
3. 基于向量空间模型文本过滤算法 [J] . 贺卫红 ,曹毅 . 系统工程 . 2005,第10期
4. 基于文本过滤技术的网络安全数据检测实验系统设计 [J] . 姚琨 ,王昕 . 现代电子技术 . 2020,第016期
5. 一个基于分层的网页文本过滤系统 [J] . 周聚 ,李培峰 ,朱巧明 . 计算机与数字工程 . 2010,第008期
6. 基于向量空间模型的文本过滤系统 [C] . 黄萱菁 ,夏迎炬 ,吴立德 . 中国中文信息学会二十周年学术会议 . 2001
7. 基于向量空间模型的自适应文本过滤系统研究 [A] . 朱祥玉 . 2006

基于向量空间模型的文本过滤系统

摘要

著录项

相似文献

相关主题

期刊订阅