首页> 外文会议>IEEE Region 10 Symposium >Classification of Bangla News Articles Using Bidirectional Long Short Term Memory
【24h】

Classification of Bangla News Articles Using Bidirectional Long Short Term Memory

机译:使用双向长期短期记忆对孟加拉新闻文章进行分类

获取原文
获取外文期刊封面目录资料

摘要

Classification is a method of assigning input vectors to one of the discrete classes. This problem can be used to identify related content such as E-commerce, news agencies, content curators, blogs, directories, and likes can use automated technologies. In this paper, we have proposed a method of classification using bi-directional LSTM to classify the Bangla news headline. We have used Bangla stop word corpus to removing stop words to get a better result in our method of classification. We have used Gensim and fastText model to vectorized our text to compatible with our machine learning model. We have built a dataset that contains around 10 lakh articles from the different renowned newspapers of Bangladesh and 8 different categories. Then we trained this data in 3 different models. Among those models, Bi-LSTM has achieved 85.14 percent accuracy, which is better than any other method.
机译:分类是一种将输入向量分配给离散类之一的方法。此问题可用于标识相关内容,例如电子商务,新闻社,内容策展人,博客,目录,并且喜欢使用自动技术。在本文中,我们提出了一种使用双向LSTM进行分类的方法来对Bangla新闻标题进行分类。我们使用孟加拉语停用词语料库来去除停用词,以在我们的分类方法中获得更好的结果。我们已经使用Gensim和fastText模型对文本进行矢量化处理,以与我们的机器学习模型兼容。我们建立了一个数据集,其中包含来自孟加拉国不同知名报纸和8个不同类别的大约100万条文章。然后,我们在3种不同的模型中训练了这些数据。在这些模型中,Bi-LSTM的准确度达到了85.14%,比其他任何方法都要好。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号