自适应信息过滤中使用少量正例进行阈值优化

夏迎炬; 黄萱菁; 胡恬; 吴立德

首页> 中文期刊>软件学报 >自适应信息过滤中使用少量正例进行阈值优化

自适应信息过滤中使用少量正例进行阈值优化

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

One special challenge in adaptive information filtering is the problem of extremely sparse data. So it is very important to learn optimal threshold while filtering the input textual stream. In this paper, an algorithm is presented for the threshold optimization. The algorithm learns fast by using few positive samples. Moreover, most of the quantities the algorithm requires can be updated incrementally, so its memory and computational power requirements are low. It also has the merits of effective, robust, and practically useful. Fudan University's adaptive text filtering system used this algorithm for the first time and came in third in all runs of TREC10. Its T10U and T10F are 0.215 and 0.414 respectively.%自适应信息过滤中一个大的挑战在于其数据稀疏问题.因此,在对输入的文本流进行过滤的同时学习最优阈值非常重要.提出了一种新颖的阈值优化算法.该算法可以通过少量的正例进行快速的学习,所需数据的获得具有增量性,故而其计算量及所需的存储空间很小.此外,该算法还具有高效、健壮、实用性强等优点.在第10届国际文本检索会议(TREC10)上,复旦大学的自适应信息过滤系统使用了该阈值优化算法,并取得了第3名的成绩.其T10U和T10F分别达到了0.215和0.414.

著录项

来源
《软件学报》|2003年第10期|1697-1705|共9页
作者
夏迎炬; 黄萱菁; 胡恬; 吴立德;
展开▼
作者单位

复旦大学,计算机科学系,上海,200433;

复旦大学,计算机科学系,上海,200433;

复旦大学,计算机科学系,上海,200433;

复旦大学,计算机科学系,上海,200433;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
自适应信息过滤; 向量空间模型; 阈值优化; 检出率; 相关反馈;
入库时间 2023-07-25 13:18:35

相似文献

中文文献
外文文献
专利

1. 基于增量学习和阈值优化的自适应信息过滤研究 [J] . 王金宝 . 计算机应用 . 2006,第005期
2. 焊接模拟中自适应高温截断技术及阈值优化 [J] . 刘学 ,徐涛 ,马龙 . 焊接学报 . 2015,第006期
3. 基于Bayesian估计的小波自适应阈值方法对图像进行去噪处理的研究 [J] . . 生物医学工程研究 . 2018,第004期
4. 基于OSTU算法利用新型水体指数进行Landsat数据自适应阈值水体自动提取研究 [J] . 赵紫薇 . 测绘与空间地理信息 . 2016,第009期
5. 基于自适应的小波阈值和GTEO进行说话人识别 [J] . 邱政权 ,尹俊勋 . 科学技术与工程 . 2006,第013期
6. TREC自适应信息过滤中的目标优化技术研究 [C] . 许洪波 ,王斌 ,程学旗 . 全国第七届计算语言学联合学术会议 . 2003
7. 基于增量学习和阈值优化的自适应信息过滤 [A] . 王金宝 . 2005

自适应信息过滤中使用少量正例进行阈值优化

摘要

著录项

相似文献

相关主题

期刊订阅