【24h】

An Improvement Approach for Word Tendency Using Decision Tree

机译:基于决策树的单词倾向性改进方法

获取原文
获取原文并翻译 | 示例

摘要

In every text, words have various frequencies and keywords have strong relationship with the subjects of their texts. Word frequencies change due to time-series variation over given periods of time. An early method estimated stability classes that indicate word popularity due to time-series variation based on frequency changes in text data over given periods using a decision tree. The estimation precision of the decision tree decreases when there is scattering of data number among classes. This paper suggests a new way to use a Random Sampling Method and proposes a new Data Copying Method to improve the estimation precision of decision tree. By using this new Data Copying Method, F-measures have improved: Increasing Class 9%; Relatively Constant Class 9%; Decreasing Class 18%.
机译:在每个文本中,单词的出现频率各不相同,关键字与文本的主题关系密切。由于给定时间段内时间序列的变化,词频也会发生变化。早期方法使用决策树,根据给定时间段内文本数据中的频率变化,估计表示由于时间序列变化而导致单词受欢迎的稳定性类别。当类别之间的数据数量分散时,决策树的估计精度会降低。本文提出了一种使用随机抽样方法的新方法,并提出了一种新的数据复制方法以提高决策树的估计精度。通过使用这种新的数据复制方法,F度量得到了改善:类别增加9%;相对恒定等级9%;降低等级18%。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号