基于句子级的领域倾向词表构建

摘要

领域倾向性词典有助于提高文本倾向性挖掘的精度,是文本倾向性挖掘研究的一个热门话题。本文分析了文本级算法构建词表的局限性。提出了一种基于句子级的领域词表构建算法。该算法引入了拉普拉斯平滑计算相关性,并将文档词频和逆文档频率的概念扩展到句子级,最后采用IB算法来对候选词进行聚类。采用该方法对酒店领域的语料进行领域倾向性词表的构建,得到了准确率为71.55%的结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号