Top-k相似短文本快速抽取算法

顾彦慧; 赵斌; 周俊生; 曲维光

首页> 中文期刊>计算机科学与探索 >Top-k相似短文本快速抽取算法

Top-k相似短文本快速抽取算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Extracting similar short texts efficiently is an essential research issue for many applications. However, most of the existing strategies focus on the effectiveness aspect. The existing state-of-the-art strategies cannot satisfy the users’performance requirement while efficiency issue is important especially for current big data applications. This paper addresses the efficiency issue of extracting similar short texts, i.e., how to efficiently get the top-k semantic similar short texts to a query for a give sentence collection. This paper also proposes an efficient strategy to tackle the performance problems based on a basic framework. Extensive experimental evaluations demonstrate that the pro-posed strategy improves the extraction efficiency while keeping the effectiveness, and is better than the existing strategies in efficiency.%如何快速有效地抽取相似短文本是许多应用系统的重要研究问题。在大数据情况下，效率问题对于实际系统非常重要，而现有的短文本抽取策略不能满足用户对性能的要求。以相似短文本的抽取为研究对象，针对传统研究中的效率问题，对如何从给定的短文本集合中快速检索出top-k个近似短文本进行了研究，并基于一个有效的基本框架提出了一种快速策略，用于满足用户对效率的要求。实验结果证明了该策略在保证有效性不变的情况下，大幅度提高了抽取效率，并且在效率上优于现有方法。

著录项

来源
《计算机科学与探索》|2014年第8期|919-932|共14页
作者
顾彦慧; 赵斌; 周俊生; 曲维光;
展开▼
作者单位

南京师范大学计算机科学与技术学院;

南京 210023;

南京师范大学计算机科学与技术学院;

南京 210023;

南京师范大学计算机科学与技术学院;

南京 210023;

南京师范大学计算机科学与技术学院;

南京 210023;

南京大学计算机软件新技术国家重点实验室;

南京 210023;

展开▼
原文格式 PDF
正文语种 chi
中图分类计算机软件;
关键词
语义相似; top-k; 排序融合;
入库时间 2023-07-25 21:27:45

相似文献

中文文献
外文文献
专利

1. 基于短文本的独立语义特征抽取算法 [J] . 胡佳妮 ,郭军 ,邓伟洪 . 通信学报 . 2007,第012期
2. 一种快速的短文本相似度检测方式 [J] . 关满祺 . 通讯世界 . 2020,第001期
3. Top-k相似连接算法性能优化 [J] . 王洪亚 ,杨利宏 ,刘晓强 . 软件学报 . 2016,第012期
4. 高效的top-k相似字符串查询算法 [J] . 陈子阳 ,韩玉俊 ,王璿 . 通信学报 . 2014,第012期
5. 融合相似度图和随机游走模型的多标签短文本分类算法 [J] . 李晓红 ,王闪闪 ,马堉银 . 计算机工程与科学 . 2021,第006期
6. 一种基于短文本的独立语义特征抽取算法 [C] . 胡佳妮 ,郭军 ,徐蔚然 . 2007年全国网络与信息安全技术研讨会 . 2007
7. 基于用户关系强度及短文本相似度的社交会话抽取研究 [A] . 潘泽彬 . 2017

Top-k相似短文本快速抽取算法

摘要

著录项

相似文献

相关主题

期刊订阅