...
首页> 外文期刊>電子情報通信学会技術研究報告. 信号処理. Signal Processing >動的辞書を用いた日本語索引化技術のサーチエンジンへの応用
【24h】

動的辞書を用いた日本語索引化技術のサーチエンジンへの応用

机译:动态字典日语索引技术在搜索引擎中的应用

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

インターネット上に存在する文書から必要な情報を得るためには,検索システム,いわゆるサーチエンジンが必要不可欠なものとなっている.そのため,サーチエンジンには使用者の要求に対して的確な返答をすることを求められる一方,常に増加する文書に対応しなくてはならない.検索対象となる文書を特徴付けているものは名詞であり,それを索引化することによっでサーチエンジンはサービスを提供するが,言語は日々変化しており,それに対応させた辞書,いわゆるコーパスを索引化の為にサーチエンジンに持たせた場合,コーパスの量だけでも膨大なものとなり,コーパスから単語を検索するだけで時間を浪費することとなる.本研究では,主に符号化に用いられる動的辞書を使用することで,コーパスを使用せずに文書内に存在する文字のみで名詞の索引化を行うため,言語の年代に左右されることのない名詞の索引化が可能になる.
机译:搜索系统,即所谓的搜索引擎,对于从Internet上存在的文档中获取必要的信息是必不可少的。因此,虽然要求搜索引擎准确响应用户的请求,但它必须响应不断增长的文档数量。表示要搜索的文档的特征是术语,搜索引擎通过为其编制索引来提供服务,但是语言每天都在变化,相应的词典(即所谓的语料库)也在不断变化。如果搜索引擎具有用于索引的上述内容,则仅语料库的数量将是巨大的,并且从语料库中搜索单词将浪费时间。在这项研究中,通过使用主要用于编码的动态词典,术语仅由文档中存在的字符索引而不使用语料库,因此它取决于语言的年龄。不使用索引命名法是可能的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号