首页> 外文会议>情報処理学会全国大会 >Geometric Algebra を用いた英語文書分類手法の日本語文書への適用に関する問題についての基礎的検討
【24h】

Geometric Algebra を用いた英語文書分類手法の日本語文書への適用に関する問題についての基礎的検討

机译:使用几何代数对日本文献分类方法的应用程序问题的基本综述

获取原文

摘要

電子文書の普及が進み,様々な場面で膨大な量の文書を管理する必要が生じている.このような文書管理においては,文書分類が不可欠となる.これまで,tf-idf や潜在意味解析(LSA)を用いた文書分類手法が報告されている[1]が,これらの多くは単語の出現順序を考慮していない.これに対し, 英語文書において, GeometricAlgebra (GA) [2]を用いることで,単語の出現順序を考慮して文書分類を行う手法が提案されている[3].この手法では,LSA に基づき,単語の出現順序に応じた不可逆な回転ベクトルを定義することで,各文書が出現する単語の順序に応じて回転され,その最終状態の違いにより文書分類を行っている.本稿では,この手法を日本語の文書分類に適用する際に生じる問題点などについて検討を行う.
机译:传播电子文件正在进行和巨大有必要管理文件的数量。这边走文档分类对于文档管理至关重要变得。到目前为止,使用TF-IDF和潜在的语义分析(LSA)报告了文档分类方法[1]其中许多人不考虑出现的单词秩序。另一方面,在英文文件中,几何通过使用代数(GA)[2],新兴单词的顺序考虑订单,提出了一种执行文档分类的方法[3]。在此方法中,基于LSA,单词根据外观顺序定义不可逆的旋转矢量响应每个文档出现的单词顺序通过最终状态差异的文件分类完成。在本文中,这种方法是日本应用Word文档分类时发生的问题检查它。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号