【24h】

人工知能を利用した短答式記述採点支援システムの開発

机译:利用人工智能开发简短答案描述评分支持系统

获取原文
获取原文并翻译 | 示例
           

摘要

センター試験など大学入試試験レベルの短答式記述試験の自動採点および人間による採点を支援する実用可能なシステムを目指して,その試作および実装をした.自然言語におけるテキスト間の同義や含意,推論を公的な試験に採用するほどの精度はこの数年では不可能であるという判断のもとに,採点は設問ごとに作題者が用意した「採点基準」に従いシステムがある程度の精度をもった採点計算(自動採点)を基本とし,その結果を人間が確認·修正できるものとする.システムは「(予め用意された)模範解答」と「(被験者の実際の)記述解答」との(ある程度の)意味的同一性や含意性を判定するほか,プロンプトと呼ばれる素材文と解答文との意味的近似性なども考慮する.また採点結果は多値分類であることから,自然言語処理でしばしば用いられているサポートベクターマシンではなく,多くの予測変数において有効に機能するランダムフォレストによる機械学習分類を使う.試作システムは Linux 上での Web システムとして動作する.大学入試の模試として実施された社会科の記述式問題 8 題に対して,3-6 点の配点の場合にシステムの提示する自動採点と人間の採点を比較すると,高度な意味的判断の要さない大半の設問においては,おおよそ 7 割から 9 割が 1 点差に収まっている.
机译:我们制作了一个原型并将其实现,目的是创建一个实用的系统,以支持对大学入学考试级别的简短答案描述性考试进行自动评分,例如中心考试和人为评分。基于最近几年无法在自然语言的文本之间采用同义词,含义和推论进行公开考试的判断,作者为每个问题准备了评分。该系统基于根据“评分标准”的评分计算(自动评分),具有一定的准确度,结果可以被人确认和纠正。系统确定“(准备的)模型答案”和“(受试者的实际)描述性答案”以及(称为提示和答案的)句子的(某种)语义身份和含义。考虑一下语义上的亲密性。另外,由于评分结果是多值分类,因此我们使用了随机森林的机器学习分类,该分类对许多预测变量都有效,而不是自然语言处理中经常使用的支持向量机。原型系统在Linux上作为Web系统运行。将系统提供的自动评分与针对3到6分的大学入学考试模拟考试所进行的社会研究的8个描述性问题的人工评分进行比较,有必要进行高度的语义判断。对于大多数问题,大约70%至90%的差异在1分以内。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号