首页> 外文OA文献 >Question Classification Menggunakan Support Vector Machines dan Stemming
【2h】

Question Classification Menggunakan Support Vector Machines dan Stemming

机译:问题分类Menggunakan支持向量机dan Stemming

摘要

Question Classification (QC) merupakan salah satu komponen penting dalam Question Answering System (QAS) karena akan berpengaruh langsung terhadap kinerja keseluruhan QAS. Sejauh ini metode yang disarankan oleh komunitas QAS untuk QC adalah menggunakan Support Vector Machines (SVM). Untuk melakukan klasifikasi teks dibutuhkan fitur berdimensi tinggi, banyaknya fitur dapat mengurangi performa SVM. Stemming adalah teknik yang digunakan untuk mereduksi term suatu dokumen. Penggunaan stemming akan berpengaruh terhadap sintaksis dan semantik suatu pertanyaan. Penelitian ini bertujuan untuk mengetahui pengaruh stemming terhadap akurasi SVM. Telah dilakukan dua percobaan klasifikasi pertanyaan, yaitu dengan menggunakan SVM dan SVM+stemming. Hasil rata-rata akurasi dari percobaan diperoleh sebesar 86.75% untuk SVM dan 87.48% SVM+stemming sehingga telah terjadi kenaikan akurasi sebesar 0.73%. Walaupun peningkatan akurasi tidak signifikan tetapi stemming dapat mereduksi fitur tanpa menurunkan akurasi SVM.
机译:问题分类(QC)是问题回答系统(QAS)的重要组成部分之一,因为它将直接影响QAS的整体性能。到目前为止,QAS社区建议的质量控制方法是使用支持向量机(SVM)。要进行文本分类,需要高维特征,许多特征会降低SVM性能。词干提取是一种用于减少文档期限的技术。词干的使用将影响问题的语法和语义。本研究旨在确定词干对SVM准确性的影响。已经进行了两个问题分类实验,即使用SVM和SVM +词干。 SVM的实验的平均准确度结果为86.75%,SVM +词干的平均准确度为87.48%,因此准确度提高了0.73%。尽管准确性的提高并不明显,但词干可以在不降低SVM准确性的情况下减少功能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号