您现在的位置: 首页> 研究主题> LDA主题模型

LDA主题模型

LDA主题模型的相关文献在2012年到2022年内共计289篇,主要集中在自动化技术、计算机技术、信息与知识传播、科学、科学研究 等领域,其中期刊论文238篇、会议论文1篇、专利文献148460篇;相关期刊161种,包括人天科学研究、情报理论与实践、情报探索等; 相关会议1种,包括2014湖北省计算机学会学术年会等;LDA主题模型的相关文献由737位作者贡献,包括何明、夏换、徐翔等。

LDA主题模型—发文量

期刊论文>

论文:238 占比:0.16%

会议论文>

论文:1 占比:0.00%

专利文献>

论文:148460 占比:99.84%

总计:148699篇

LDA主题模型—发文趋势图

LDA主题模型

-研究学者

  • 何明
  • 夏换
  • 徐翔
  • 杜永萍
  • 黎楠
  • 万常选
  • 严海明
  • 于维杰
  • 何灵敏
  • 余璇

LDA主题模型

-相关会议

  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 冼广铭; 王鲁栋; 曾碧卿; 梅灏洋; 陶睿
    • 摘要: 文本分类是自然语言处理的基础任务,文本中的特征稀疏性和提取特征所用的神经网络影响后续的分类效果。针对文本中的特征信息不足以及传统模型上下文依赖关系方面不足的问题,提出经过TF-IDF加权的词向量和LDA主题模型相融合,利用双向门控循环神经网络层(BiGRU)充分提取文本深度信息特征的分类方法。该方法主要使用的数据集是天池比赛新闻文本分类数据集,首先用Word2vec和LDA模型分别在语料库中训练词向量,Word2vec经过TF-IDF进行加权所得的词向量再与LDA训练的经过最大主题概率扩展的词向量进行简单拼接,拼接后得到文本矩阵,将文本矩阵输入到BiGRU神经网络中,分别从前后两个反方向提取文本深层次信息的特征向量,最后使用softmax函数进行多分类,根据输出的概率判断所属的类别。与现有的常用文本分类模型相比,准确率、F1值等评价指标都有了较高的提升。
    • 杨培琛; 莫赞; 周晓辉; 赵琦智
    • 摘要: 为了揭示粤港澳大湾区人才培养政策演化规律以及产业未来发展趋势,运用LDA主题模型分阶段提取主题及每个主题下的关键词汇,揭示政策内容演化;运用TF-IWF算法分阶段提取每个政策文件的前n个关键词,揭示专业领域演化。研究结果表明:大湾区人才培养政策已经历探索、起步阶段,现处于高速发展阶段,高新技术、绿色金融、健康等专业领域将随着大湾区的发展逐渐壮大。为此,高新技术、绿色金融和健康等产业未来具有上升空间,创业者可加大探索力度,把握住大湾区未来的发展机遇,为大湾区创造价值。
    • 刘鸣筝; 芦猛
    • 摘要: “躺平”作为2021年“十大网络热词”之一,引发了大量的关注和讨论。本文以新浪微博中有关“躺平”和“内卷”的内容为研究数据,基于词频统计和LDA主题模型提取主题,从文本特征透视青年亚文化的情绪表达。通过对文本数据进行分析发现,“躺平”的微博内容主要呈现出青年的“躺平原因”“内心情感”“寻求寄托”“享受生活”四个主题;而“内卷”的微博内容主要呈现出青年人视角下“内卷严重”“生活压力”“反抗内卷”“教育内卷”四个主题。“躺平”和“内卷”的话语表达折射出了当代青年人的生活现状和内心情感。对文本内容进行分析之后,本文探析了“躺平”和“内卷”流行的成因以及青年亚文化表征,并对青年亚文化的情绪表达进行思考。
    • 孙小红
    • 摘要: 本文基于乡村振兴战略背景研究温州各高校学生公益实践以及向社会创业转化现状,通过LDA主题模型对温州11所高校33位大学生乡村公益实践活动向社会创业转化的参与者和11位相关负责团学的老师访谈进行分析,发现大学生公益乡村公益实践团队宣传存在不足、难点较多等问题,需要建立专业团队、识别创业机会、平衡公益与创业,以及政府支持助推,以促进大学生公益实践向社会创业转化,从而使大学生乡村公益实践可持续性开展,促进乡村经济发展。
    • 文勇军; 何环晶; 唐立军
    • 摘要: 固定标签协同过滤推荐算法,未充分考虑标签因子的多样化,主要依靠人工标记,扩展性不强,主观因素多。本文从用户的喜好特征因素角度出发,在固定标签协同过滤推荐算法的基础上,提出一种隐式标签协同过滤推荐算法。该算法利用LDA主题模型生成项目文本的隐式标签,得到项目-标签特征权重,根据算法性能优化的要求选择标签数量,将项目-标签矩阵与用户评分矩阵结合得到用户对标签的偏好矩阵,最后通过协同过滤算法产生推荐。实验结果表明,本文提出的基于LDA的隐式标签协同过滤推荐算法缓解了数据稀疏性问题,项目推荐的召回率、准确度和F1值有较大提升。
    • 柯雨淋; 杨中华; 沈雨涵; 叶健宏; 周凇航
    • 摘要: 现有城市形象评价方法大都依赖于评价者主观提出的指标体系,针对此现象,提出一套以微博数据为基础的城市形象评价方法,在一定程度上提升评价过程的客观性与可重复性。首先对获取到的城市数据预处理后,运用K-Means聚类算法得到城市形象的评价类别;其次采用LDA主题模型对有效类别总结主题、提取二级指标操作,利用情感分析技术计算目标城市情感得分即为城市形象评分;最后以武汉市和苏州市为例,利用该方法评价了城市形象。
    • 王雨婷
    • 摘要: 知识类短视频近几年在各视频平台迅速发展。本研究基于词频分析法和LDA主题模型两种研究方法,对B站知识区UP主“无穷小亮的科普日常”播放量前五的视频评论内容进行分析,从文本特征的角度分析用户对知识类短视频的关注倾向和讨论角度。研究发现,用户评论的关注点主要集中于账号运营者和科普内容本身,其文字表达体现出强烈的年轻化语态特征。
    • 龙艺璇; 安源; 王东晋; 翟夏普; 伊惠芳
    • 摘要: 高效挖掘海量铁路领域科研成果数据中蕴含的主要内容是铁路领域科研人员在大数据时代亟待解决的重要问题。LDA模型是用于主题发现的主流方法,但在面向多单词短语居多的铁路领域研究文献时存在使用受限的问题,因此本文提出一种LDA模型的改进算法:一方面在构建主题模型前,对文本作预处理时抽取语料中的名词短语、动词短语、名词和动词;另一方面在主题模型构建完成后,融合TextRank算法与PMI算法得出关键词组块,并以此替换LDA主题识别结果中的主题词,进一步丰富主题的语义。最后,以铁路领域“牵引供电系统”为例开展实证研究。结果表明,本文提出的改进LDA模型有助于提升铁路领域主题发现结果的可解释性与可识别性,可以为后续铁路领域科研管理中知识服务的实现提供有效的方法支持。
    • 王克勤; 刘朝明
    • 摘要: 基于在线评论的产品设计改进研究,受到越来越多学者的关注。然而,现有研究仍有很多局限,如忽略竞争产品分析以及无法获取细粒度顾客需求等。为解决上述问题,提出一种基于在线评论的重要度绩效竞争对手分析方法(IPCA)。首先,应用隐含狄利克雷分布(LDA)主题模型识别产品主题,基于文档—主题概率分布计算产品特征重要度;其次,通过依存句法分析提取情感标签,并将其量化为产品特征绩效值;然后,构建多个IPCA模型找到目标产品的待改进特征;最后,从原始负面评论中提取用例,获取顾客细粒度需求并发现产品问题,进而提出产品设计改进策略。以汽车之家口碑数据为例,验证了所提方法的有效性。
    • 高芳芳; 林心婕
    • 摘要: 根据微博热搜话题榜上有关在线问诊的热门话题下相关的3077条舆情数据,研究通过LDA主题模型和情感分析考察了围绕在线问诊的舆论焦点和网络情绪,从而了解微博舆论中针对在线问诊这一新型医疗方式的关注重点及网络情绪的类型倾向。研究发现,围绕在线问诊的微博舆论聚焦的主题包括在线问诊与信息监管、在线问诊与死亡戏谑、在线问诊的核心需求;针对在线问诊的网络情绪偏负面,体现出公众对在线问诊一定的不信任感;在围绕在线问诊的微博舆论中,实名认证的微博用户发言更偏中性谨慎,而非实名认证用户的发言则更情绪化。基于该分析结果,研究提出了针对在线问诊的网络舆情应对及情绪引导的相关建议。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号