...
首页> 外文期刊>電子情報通信学会技術研究報告. デ-タ工学. Data Engineering >バースト現象を考慮したハッシュタグのクラスタリング手法の提案
【24h】

バースト現象を考慮したハッシュタグのクラスタリング手法の提案

机译:考虑爆破现象的哈希特聚类方法的提案

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Twitterにおいてバースト現象が確認されたハッシュタグを収集することは,現実世界で流行している話題を抽出する上で重要なアプローチである.しかしハッシュタグには表記揺れや抽象度が曖昧な性質が存在するため,同じ話題を指し示しているタグが重複したり,バーストしていないタグでもバーストしたタグと同じ話題を示すタグが存在する可能性がある.この問題を解決するためにハッシュタグのクラスタリングが必要であるが,全てのタグのクラスタリング処理は計算コストが高いため,効率的な手法が必要となる.本研究では,以上の問題を効率的に解決することを目的として,バーストしたハッシュタグのみクラスタリングを行い,得られたクラスタにバーストしていないハッシュタグを割り当てる手法を提案する.これによりクラスタリングのサンプル数はバーストしたハッシュタグだけになるため,クラスタリングに掛かる処理時間が短縮できる.提案手法では,移動平均線収束拡散法によってハッシュタグのバーストの強さを数値化し,異常値を持つとして検出されたハッシュタグをバーストしたハッシュタグとみなす.そして,バーストしたハッシュタグをた平均法によってクラスタリングし,バーストしていないハッシュタグを生成したクラスタに割り当てる.本稿では,先行研究の手法によって生成されたクラスタと比較して,提案手法によるクラスタが,話題に対するハッシュタグの網羅性が高く,クラスタリングにかかる処理時間が大幅に短縮されることを報告する.
机译:在Twitter中收集具有突发现象的Hashtag是提取现实世界中普遍的主题的重要方法。但是,由于HASHTAG具有含糊不清和抽象的抽象程度,因此指向同一主题的标签,或指示与突发标签或BIRST标签相同的主题的标签。虽然需要对HASHTAG的聚类来解决此问题,但所有标签集群流程都具有高的计算成本,需要有效的方法。在这项研究中,我们提出了一种仅聚集突发的突发标签并将没有突出到所得集群的HASHTAG的方法,以便有效地解决上述问题。结果,由于群集样本的数量仅仅是突发散列拖船,因此可以缩短应用于聚类的处理时间。在所提出的方法中,移动平均线收敛扩散方法量化HashTAG的突发强度,并且被认为是突出被检测到的具有异常值的HASHTAG的散列标签。然后,突发的HashTag是通过普通方法群集的,并分配给已生成不奏向HASHTAG的群集。在本文中,与先前研究方法产生的集群相比,所提出的方法的集群在主题上高度完全降低了群集的HASHTAG,并报告了聚类的处理时间显着降低。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号