首页> 外文期刊>電子情報通信学会技術研究報告. 回路とシステム. Circuits and Systems >遺伝的プログラミングによる分類関数近似を用いた文書分類とその応用
【24h】

遺伝的プログラミングによる分類関数近似を用いた文書分類とその応用

机译:文档分类及其应用使用遗传编程的分类函数近似

获取原文
获取原文并翻译 | 示例
           

摘要

多量のデータ蓄積に対してクラスタ分類や検索を自動的·効率的に実施し,意思決定に用いることが求められている。 報告では,遺伝的プログラミング(Genetic Programming: GP)手法を用いて,文書クラスタ分類の手法を提案し,その応用について述べる。これまでのテキスト分類手法ではキーワード出現頻度などの特徴ベクトルを用いてサンプル間の距離を求めていたが,精密な解析には適当ではない。 報告では特徴ベクトルによる非線形の分類関数近似を行うことにより柔軟なシステム構成法を提案すると同時に,キーワード出現順序などの条件をGP手法で改善したルールとして記述し,これによるテキスト分類を実施する方法を提案する。 報告では学習データとして分類が判明している文書と特徴ベクトルを与え分類されるクラスタごとに,分類のための分類関数をGPにより構成していく。 次に,クラスタ分類が未知である文書を入力し,これらの個体の中で適合度が最高となるクラスタに所属すると判断する。 応用例として,最初に人工的に生成した文書による分類シミュレーションを取り上げ,次に実際の経済記事のクラスタリング評価問題を示す。
机译:需要自动和有效地执行集群分类和搜索,以便大量数据累积,并使用它以进行决策。在报告中,我们提出了一种使用遗传编程(GP)方法的文档集群分类方法,并描述其应用程序。在先前的文本分类技术中,尽管使用诸如关键字外观的发生的特征向量确定样本之间的距离,但是它不适用于精确分析。在该报告中,通过特征向量执行非线性分类功能来提出灵活的系统配置方法,同时,诸如关键字外观顺序的条件被描述为改善GP方法的规则,并且存在实现文本的方法提出的分类。在报告中,分类的分类函数由GP为每个群集被归类为学习数据和分类。接下来,确定集群分类是未知的,并且确定这些个体中的适合度是最高的。作为应用示例,我们首先通过人工生成的文件解决分类模拟,然后显示实际经济文章的聚类评估问题。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号