首页> 中文学位 >类层叠和特征扩充的竞品公司推荐方法研究
【6h】

类层叠和特征扩充的竞品公司推荐方法研究

代理获取

目录

第一个书签之前

展开▼

摘要

标签是人们获取文档主题的重要方法之一,在信息检索和自然语言处理等领域均有重要应用。现有的方法仅依赖于词条统计数据进行推荐,而没有考虑文档主题信息对标签词提取的影响。标签词提取的方法主要考虑文档主题信息。相比于传统主题模型的隐含参数获取精度值较低以及在隐含参数估计迭代缓慢等问题,提出采用改进的变分EM算法进行参数估计,并在其中加入信息熵原理来获取其中隐含参数,提高模型隐含参数的精度,在参数估计的前期采用Aitken迭代加速方法,并在后期采用Broyden对称秩1校正公式加速算法的迭代收敛速度,进而来提高模型的整体效果,并通过实验比较得出改进后的算法在运行效率和效果上有明显的提升。 采用分类模型对爬取到的企业进行三级分类,对获取到的每个企业的标签词链,作为输入到预设的耦合网络模型,确定每一个词语对在预设的每一种企业类型中的语义完整相关性。进而,确定各个词语对属于每一种企业类型的耦合概率,并将最大耦合概率对应的企业类型确定为待分类企业信息的企业类型。这样,对于直接获取的待分类企业信息,能基于各个词语间的语义关联度,确定对应的企业类型,从而提高分类的准确性。通过灰色随机抽样的方式进行人工评测结果,结果分析经过不断的优化,可使分类的效果达到一款产品的要求。 基于标签知识抽取和分类算法联合使用,并在最终分类结果的同类别中使用文本余弦相似度算法来计算企业与企业之间相似度,通过这三步组合与叠加式和设置相似阈值进行竞品公司结果推荐,可以为企业在市场竞争中尽早以及准确的发现竞品公司,以便在后续发展中做出决策与判断。

著录项

  • 作者

    赵全颖;

  • 作者单位

    辽宁工程技术大学;

  • 授予单位 辽宁工程技术大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 邢长征;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 航空用材料;船舶工程;
  • 关键词

    层叠; 特征; 扩充; 公司;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号