向量空间模型
向量空间模型的相关文献在1993年到2022年内共计1128篇,主要集中在自动化技术、计算机技术、科学、科学研究、信息与知识传播
等领域,其中期刊论文1004篇、会议论文99篇、专利文献228235篇;相关期刊332种,包括情报杂志、现代图书情报技术、计算机工程等;
相关会议75种,包括第二届信息、电子与计算机工程国际学术会议、第六届全国信息检索学术会议、第九届全国计算语言学学术会议等;向量空间模型的相关文献由2231位作者贡献,包括林鸿飞、吴立德、樊孝忠等。
向量空间模型—发文量
专利文献>
论文:228235篇
占比:99.52%
总计:229338篇
向量空间模型
-研究学者
- 林鸿飞
- 吴立德
- 樊孝忠
- 黄萱菁
- 姚天顺
- 战学刚
- 谢飞
- 刘培玉
- 夏迎炬
- 李生
- 胡学钢
- 邢玉娟
- 郑诚
- 陈刚
- 何丕廉
- 何中市
- 张燕平
- 曹晓丽
- 杨小平
- 白硕
- 程学旗
- 索红光
- 胡恬
- 余正涛
- 傅间莲
- 刘军万
- 刘挺
- 刘海峰
- 刘群
- 刘飞飞
- 原福永
- 吴晓蕊
- 宋丹
- 廖祝华
- 张志强
- 张成文
- 徐建锁
- 易爱平
- 朱巧明
- 李斌
- 李生红
- 李静
- 杨志豪
- 杨飞
- 林亚平
- 王卫玲
- 王文杰
- 罗振声
- 苏小虎
- 董宝力
-
-
陈柯;
柴启栋
-
-
摘要:
文章从问题意识视角出发,以石油术语为基础,引入词向量空间模型的方法展开三个相关实验对机器译文和人工译文进行对比研究,探索机器翻译结果在空间模型中的演绎和呈现。实验结果显示机器翻译对于石油术语的语言翻译准度能达到0.403。文章尝试结合计算机技术、语言学和翻译学等不同领域量化论证两种翻译结果在语义层面的接近和靠拢程度,以期探索评价分析机器翻译系统输出结果质量的新途径。
-
-
赵京胜;
宋梦雪;
高祥;
朱巧明
-
-
摘要:
自然语言处理是人工智能的核心技术,文本表示是自然语言处理的基础性和必要性工作,影响甚至决定着自然语言处理系统的质量和性能.探讨了文本表示的基本原理、自然语言的形式化、语言模型以及文本表示的内涵和外延.宏观上分析了文本表示的技术分类,对主流技术和方法,包括基于向量空间、基于主题模型、基于图、基于神经网络、基于表示学习的文本表示,进行了分析、归纳和总结,对基于事件、基于语义和基于知识的文本表示也进行了介绍.对文本表示技术的发展趋势和方向进行了预测和进一步讨论.以神经网络为基础的深度学习以及表示学习在文本表示中将发挥重要作用,预训练加调优的策略将逐渐成为主流,文本表示需要具体问题具体分析,技术和应用融合是推动力.
-
-
彭建
-
-
摘要:
为实现高校图书资源的准确推送,本文提出了一套基于《中国图书馆分类法》的高校图书馆用户兴趣模型。本文详细介绍了用户兴趣模型的设定与更新方法,并运用《中国图书馆分类法》和《汉语主题词表》来确定文献主题词,进而建立基于主题词的文献特征向量,在此基础上计算文献特征向量与用户兴趣特征之间的相似度,最终实现文献资源的精确推送。
-
-
房悦
-
-
摘要:
针对现有检索算法在实际应用中存在查准率低、查全率低和查找速度慢的问题,文章基于向量空间模型设计网络信息智能检索算法。建立网络信息检索规则和查询扩展检索规则,引入向量空间模型,对网络信息索引项权重进行分配;计算门槛值实现网络信息过滤,并对过滤后检索结果输出。通过对比实验证明,设计的检索算法查准率和查全率更高。
-
-
马艳荣;
温煜坤
-
-
摘要:
为了解决传统对外汉语应用文写作词汇分类系统存在分类精度低、运行空间占用过大的问题,提出基于向量空间模型的对外汉语应用文写作词汇分类系统.首先,分析系统功能,对外汉语应用文写作词汇分类系统的主要功能为训练与词汇判定.根据上述的分析结果,明确分类系统的大致程序,并构建系统的总体结构.其次,设计系统的硬件与软件,硬件部分主要包括词汇训练模块、特征权重计算模块以及词汇分类模块.软件部分计算词汇特征权重值,并基于向量空间模型完成对外汉语应用文写作词汇的分类.最后,进行验证实验.实验结果表明,与传统的词汇分类系统相比,基于向量空间模型的分类系统具有更高的分类精度,并且运行空间占用明显缩小.
-
-
杨柳;
吴彦蓉
-
-
摘要:
以图书馆的常见问题为基础,研究全文检索、中文分词、向量空间模型等技术,构建符合相关问题的知识库,结合云数据库设计,在微信小程序平台运用JavaScript,WXML,WXSS,Python等开发语言和Flask框架,实现一个基于微信小程序的图书馆智能客服系统,其中的智能回复模块实现了全文检索和中文分词等技术,以鲜明的便捷性、开放性和自主性拓宽了图书馆的智能服务模式.
-
-
卢洋;
石元博
-
-
摘要:
为解决信息检索时不同用户对搜索结果有不同期望的问题,提出了一种基于向量空间模型的个性化网页搜索算法.针对用户不同兴趣,利用用户画像能够更加全面地表示用户兴趣的特点,通过向量空间模型建立用户画像来表达用户兴趣,结合传统的网页排序算法得出最终的网页排序结果.对于不同用户可得到不同的网页搜索结果,排序靠前的网页中符合用户兴趣的网页数量增多.通过对模拟网页搜索实验结果的分析,证明所提算法较传统PageRank算法在个性化网页搜索方面有所提高.
-
-
王海涛;
向竹君;
刘健;
袁建锋
-
-
摘要:
当前,利用非结构化数据进行信息提取是地理信息领域的研究热点.针对这一热点,本文提出了基于中心向量的KNN分类方法.首先,对向量空间模型的特征项选择及权重计算方法进行了改进;其次,利用KNN算法对非结构化数据进行了分类与排序;最后,以与郑州市相关的200篇网络资源为非结构数据语料库进行验证.实验表明:该方法能够有效地提取非结构数据的城市属性信息,计算效率较高,实用性较强.
-
-
赵瑞丹;
朱旭
-
-
摘要:
为满足当前高校学生舆情监督的工作需要,针对传统网络舆情采集系统的舆情信息采集效率低下、质量差等问题,设计和开发了一套基于爬虫技术与语义分析的网络舆情采集系统.该系统通过主题网络爬虫对互联网上感兴趣的资源数据进行爬取,同时利用语义分析中的向量空间模型(VSM)算法对采集到的网页数据进行进一步过滤,充分保证所采集到的舆情数据的质量.系统的各项性能试验测试结果表明,文中所设计的系统能够按照用户需求在保证效率和质量的情况下,较好地完成互联网舆情信息采集,验证了系统的可行性.
-
-
李孟宁
-
-
摘要:
词向量作为自然语言处理的基础技术,随着大数据和深度神经网络的发展,其算法也随之得到了更好的发展,尤其是近些年来各类新式算法和思想层出不穷,使得自然语言处理的准确度得到极大的提升.在阐述各个词向量算法的同时,穿插例子和图表,使大众更加清晰透彻理解算法的过程和优缺点.通过对词向量算法的发展进行整体的回顾,加深对词向量的理解,在解决问题的前提下为正确选用哪种词向量而做出更好的判断.
-
-
HU Renfen;
胡韧奋;
ZHU Yuchen;
诸雨辰
- 《第三届CCF国际自然语言处理与中文计算会议》
| 2014年
-
摘要:
将文本分类技术引入唐诗研究.首先将唐诗按照题材分为爱情婚姻、边塞战争、交游送别、羁旅思乡、山水田园、咏史怀古和其他7类,并据此提出唐诗题材自动分类模型.所选500首诗歌样本以《唐诗三百首》为基础,并有所补充.采用向量空间模型(VSM)将唐诗文本转换为向量,通过卡方检验进行词语特征选择,最后基于朴素贝叶斯和支持向量机算法构造文本分类器,取得较好的题材分类效果.此外,还验证了作者关于题目、体制、作者等变量对题材分类产生影响的假设,为相关诗歌本体研究提供了科学依据。
-
-
FENG Yong;
冯永;
HAN Nan;
韩楠;
JIA Dongfeng;
贾东风
- 《2013年全国开放式分布与并行计算学术年会》
| 2013年
-
摘要:
为从微博服务平台产生的大量实时信息中抽取新闻事件,提出了一套完整的云计算环境下的微博事件检测跟踪算法.首先采用新的基于微博转发数和评论数的权值计算方法,将微博文本表示成向量空间模型;再利用基于代表点的增量层次密度聚类(RIHDBSCAN)算法抽取关健词,最终实现新闻事件的检浏和跟踪。针对单一节点无法快速高效地处理海量微博数据的问题,将算法部署在云计算平台Hadoop上。通过在新浪微博平台上获取的真实数据进行实验,结果表明,所提出的权值计算方法比TF-IDF和UF-ITUF有更高的性能,并且云框架的使用较好地提高了处理速度,适合用于海量数据的分析和挖掘。
-
-
-
-
-
LIU Kuo;
刘阔;
YAO Shuyang;
姚舒扬;
DENG Zhihong;
邓志鸿
- 《第29届中国数据库学术会议》
| 2012年
-
摘要:
信息社会中在线百科已成为人们获取知识的重要途径,而在线百科的标签系统作为其重要组成部分,不仅可以帮助人们在浏览某张页面时获取其他相关页面的信息,而且对于海量文本分类,以及提高在线百科检索系统的检索效率都有很大帮助.充分利用在线百科页面间的链接关系,提出了一种基于页面间的同质性原理和向量空间模型的全新针对在线百科的标签推荐算法HVSM.该标签推荐算法具有普适性,可在不同在线百科系统间推荐标签.实验结果表明,通过与朴素推荐算法NAM进行比较,新的推荐算法可以达到更高的准确率.并且通过对实验数据进行分析,得到了若干有益的结论,为今后的研究工作奠定了基础.
-
-
李虎;
邹鹏;
贾焰;
周斌
- 《第26次全国计算机安全学术交流会》
| 2011年
-
摘要:
该文首先介绍了文本过滤模型的特点以及发展状况。针对传统信息过滤处理方式无法满足现阶段海量数据环境下业务需求这一现状,该文提出了一种基于MapReduce框架的文本数据过滤模型,实现了传统的向量空间模型的分布式扩展。在实际环境中的测试表明,该模型的过滤精度和速度都较为理想,较好的满足了用户的需求。
-
-
-
-
-
-
-
-
-
- 锦州医科大学
- 公开公告日期:2020.09.29
-
摘要:
本发明公开了一种基于向量空间模型的英汉语料提取方法,包括:步骤1、分别对汉语和英语语料库进行预处理;步骤2、构建双向前后文词语向量空间模型;步骤3、进行计权等效分析,将第一升序集合{km,k2,k1,k3··ki··k4}中的英语单词依次进行计权等效相似度Sim(ki)|计权计算,所述计权等效相似度Sim(ki)|计权为:其中,ωai为第一计权因子,ωbi为第二计权因子;步骤4、将Sim(k1)|计权、Sim(k2)|计权、…Sim(ki)|计权、…、Sim(km)|计权中最大数值对应的英语单词确定为汉语语料中心词语的词对,建立中英双语词表。本发明的基于向量空间模型的英汉语料提取方法基于双向向量空间模型,大大提高语言在翻译过程中传输的准确度。
-
-
-
-
-