首页> 中文期刊> 《广东农业科学》 >基于农业垂直搜索引擎中文分词词典的构建研究

基于农业垂直搜索引擎中文分词词典的构建研究

         

摘要

在农业垂直搜索引擎研究过程中,中文分词是重要的研究方向.针对传统农业垂直搜索引擎搜索信息抽取不准确、速度慢等缺点,采用双数组Trie树为基本模型,利用中文词条首字区位码与数据库表行号相对应的方式,并根据农业垂直搜索引擎的需要设置了农业词汇的词性编码,以MySQL数据库为例设计了农业领域专用的分词词典.该分词词典可充分利用数据库的优势进行词典组织,并且可以进行词库的远程共享和共同维护,方便不同的系统进行访问;词条按首字分类存放构造双数组Trie树,可有效减少构造过程的内存空间.该农业分词词典结构对其他领域和行业也具有借鉴意义.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号