首页> 外文期刊>電子情報通信学会技術研究報告 >全単語間共起を考慮した概念ベース生成手法
【24h】

全単語間共起を考慮した概念ベース生成手法

机译:考虑所有词共现的基于概念的生成方法

获取原文
获取原文并翻译 | 示例
       

摘要

When generating the concept vector as the meaning representation for the word, we propose a method that the co-occurrences between all words can be considered by allocating a random, unique number set to each word and generating the co-occurrence matrix between words and numbers. The method has the feature that the memory usage for generating and using the concept vectors doesn't increase though information on the co-occurrences between all words is contained. We also propose a method that word concept vectors generated thus are clustered, and the number of the cluster generated as a result is allocated to each word, and then the co-occurrence matrix between words and clusters is generated and united with the co-occurrence matrix between words and numbers. When the accuracy of various linguistic processing was measured by using the concept vector generated with these methods, we confirmed the effectiveness of our method compared with the conventional method.%単語の意味表現としての概念ベクトルの生成方式として,各単語にランダムでかつユニークな番号集合を振り,単語・番号間共起行列をとることにより,全単語間の共起を考慮できる方式を提案する.提案方式は,全単語間共起の情報を含みながら,概念ベクトル生成及び使用におけるメモリ使用土が増えることはないという特徴をもつ.また,こうして生成した単語概念ベクトルをクラスタリングし,その結果できたクラスタの番号を各単語に振り,単語・クラスタ間共起行列をとって,単語・番号間共起行列と結合させる方式も提案する.これらの方式により生成した概念ベクトルを使用して,各種言語処理の精度を測定したところ,従来の概念ベクトル生成方式で生成した概念ベクトルを使用するよりも精度が向上することを確認した.
机译:当生成概念向量作为单词的含义表示时,我们提出了一种方法,可以通过为每个单词分配一个随机的唯一数字并生成单词和数字之间的共现矩阵来考虑所有单词之间的共现。该方法具有以下特征:尽管包含关于所有单词之间的共现的信息,但是用于生成和使用概念向量的存储器使用不会增加。我们还提出了一种方法,将这样生成的单词概念向量进行聚类,然后将生成的聚类数量分配给每个单词,然后生成单词和聚类之间的共现矩阵并将其与共现统一单词和数字之间的矩阵。当使用这些方法生成的概念向量测量各种语言处理的准确性时,我们证实了该方法与传统方法相比的有效性。%単语の意味表现としての概念ベクトルの生成方式として,各単语にランダムはユニークな番号集合を振り,単语・番号间共起行をとることにより,全単语间の共起を考虑できる方式を进行する。逐步方式は,全単语间共起の情报を含みながら,また,こうして生成した単语概念ベクトル生成クラスタリングし,その结果した単きたクラスタの番号を各単语に振り,単语・クラスタ间共起行列をとって,単语・番号间共起行列と结合させる方式も实施する。これらの方式により生成した概念ベクトルを使用して,各种言语处理の精度を测定したところ,従来の概念ベクトル生成方式で生成した概念ベクトルを使用するよりも精度が向上することを确认した。

著录项

  • 来源
    《電子情報通信学会技術研究報告》 |2010年第27期|p.151-156|共6页
  • 作者单位

    日本電信電話株式会社 NTTサイバーソリューション研究所 〒239-0847 神奈川県横須賀市光の丘1-1;

    日本電信電話株式会社 NTTサイバーソリューション研究所 〒239-0847 神奈川県横須賀市光の丘1-1;

    日本電信電話株式会社 NTTサイバーソリューション研究所 〒239-0847 神奈川県横須賀市光の丘1-1;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 jpn
  • 中图分类
  • 关键词

    概念ベース; 共起行列; クラスタリング;

    机译:概念库;共现矩阵;聚类;
  • 入库时间 2022-08-18 00:32:53

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号