首页> 外文会议>電子情報通信学会;情報科学技術フォーラム >日本語WordNet における語義・概念の分散表現獲得
【24h】

日本語WordNet における語義・概念の分散表現獲得

机译:日语WordNet中单词含义和概念的分布式表达的获取

获取原文

摘要

辞書資源は,意味役割付与等の自然言語処理分野のタスクに利用されている.これらのタスクの性能は辞書資源の持つ語彙に大きく制限される.すなわち,タスクの性能向上のためには,既存の辞書資源を更新・拡張していく必要がある.しかし人手で辞書の語彙を増やすことは,多大なコストと時間を要するため,辞書資源の更新を自動化する研究が行われてきた.また辞書資源の自動更新には分散表現を利用するものが多く存在する。その分散表現獲得手法として,近年word2vecやfasttext 等が注目されており,文書分類などの自然言語処理のタスクに適用されている.しかし多くの分散表現獲得手法は,多義語の場合にも1 つの単語に1 つの分散表現を割り当てるため,各語義に対応した分散表現を得る事は出来ない.また,複数語義の分散表現は分散表現を獲得するために用いたコーパスに強く影響されるという特徴がある.この問題を解決することが出来れば,語義曖昧性解消等の意味タスクにおいて有用であると考えられる.
机译:词典资源用于自然语言处理领域,例如分配语义角色。 它用于任务。这些任务的执行 它极大地局限于词典资源的词汇表。那是, 更新/扩展现有字典资源以提高字典性能 有必要伸展。但是,手动增加词典的词汇量 由于简化该过程需要花费大量成本和时间,因此它是词典资源。 已经进行了研究以使源代码更新自动化。也是字典资源 有许多使用分布式表示形式的自动源更新。 到。近年来,word2vec已被用作获取分布式表达式的方法。 而快速文本正引起人们的关注,例如文档分类。 它适用于自然语言处理的任务。但是很多 即使在多义单词的情况下,的分布式表达获取方法也是一个单词。 由于分配了一个分布式表达式,因此支持每个单词的含义。 无法获得分布式表示。另外,对于多种含义 分散的表达式是用于获取分布式表达式的语料库。 它具有受到强烈影响的特征。解决这个问题 如果可能,执行语义任务,例如消除歧义 它被认为是有用的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号