首页> 外文OA文献 >PENERAPAN MODEL MESIN BELAJAR SUPPORT VECTORudMACHINES PADA AUTOMATIC SCORING UNTUK JAWABANudSINGKAT
【2h】

PENERAPAN MODEL MESIN BELAJAR SUPPORT VECTORudMACHINES PADA AUTOMATIC SCORING UNTUK JAWABANudSINGKAT

机译:学习机模型支持向量的应用针对答案的自动评分机简介

摘要

Sistem automatic scoring untuk jawaban singkat (ASJS) merupakan sistem yang melakukan proses penilaian jawaban dengan bantuan metode komputasi. Jawaban yang diberikan biasanya menggunakan bahasa natural. ASJS dibangun dengan harapan dapat mengoptimalkan proses pemeriksaan soal dengan tipe jawaban singkat. Permasalahan umum yang dihadapi dalam sistem adalah penggunaan bahasa natural yang membutuhkan proses preprocessing agar bisa dikomparasi. Permasalahan kedua adalah tidak tersedianya dataset jawaban dan kunci jawaban untuk bahasa Indonesia. Dalam penelitian ini penulis akan membangun dataset baru dan menerapkan model klasifikasi Support Vector Machines (SVM) pada sistem. Input dari metode SVM adalah hasil dari proses preprocessing pada bahasa natural. Proses ini meliputi stemming, penghapusan stopwords, penghitungan selisih jumlah kata, penghitungan nilaiudkesamaan kata, penghitungan nilai kesamaan struktur kalimat dan penghitungan nilai kesamaan kalimat dengan algoritma jaccard. Hasil dari eksperimen adalah ditentukannya empat fitur penting yang ada dalam dataset. Fitur tersebut adalah selisih jumlah kata, nilai kesamaan jenis kata, nilai kesamaan kalimat dan nilai kesamaan jenis kalimat. Nilai akurasi yang diberikan oleh metode SVM kernel linier dan kernel RBF sebesar 89% dengan nilai mean absolute error sebesar 0,044. Nilai ini lebih baik jika dibandingkan dengan metode Regresi Logistik dan C4.5.
机译:简短答案自动评分系统(ASJS)是一种借助计算方法评估答案的系统。给出的答案通常使用自然语言。建立ASJS的目的是优化具有简短答案类型的问题检查过程。系统中遇到的一个常见问题是使用自然语言,这要求预处理过程具有可比性。第二个问题是答案数据集和印度尼西亚语答案键的不可用。在这项研究中,作者将建立一个新的数据集,并将支持向量机(SVM)分类模型应用于系统。 SVM方法的输入是自然语言中预处理过程的结果。该过程包括词干提取,删除停用词,计算词数差异,计算词的值,计算句子结构的相似度以及使用jaccard算法计算句子相似度的值。实验的结果是在数据集中确定了四个重要特征。这些特征是单词数量的差异,单词类型的相似度值,句子的相似度值和句子类型的相似度值。线性核SVM方法和核RBF提供的精度值为89%,平均绝对误差为0.044。与Logistic回归和C4.5方法相比,此值更好。

著录项

  • 作者

    Haritama Agus Aditya;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号