首页> 外国专利> Word collection method and system for use in word-breaking

Word collection method and system for use in word-breaking

机译:用于断词的词收集方法和系统

摘要

A method, computer readable medium and system are provided which collect new words for addition to a lexicon for an agglutinative language. In the method, a log of queries submitted to a search engine is obtained. The log of queries is sorted to obtain sorted queries. The sorted queries are then filtered using a plurality of heuristic criteria to obtain a candidate list of new words. Words from the candidate list of new words are then added to a lexicon.
机译:提供了一种方法,计算机可读介质和系统,该方法,计算机可读介质和系统收集新词以添加到用于凝集语言的词典中。在该方法中,获得提交给搜索引擎的查询日志。查询日志经过排序以获得排序后的查询。然后使用多个试探标准过滤排序的查询,以获得新单词的候选列表。然后将候选单词列表中的单词添加到词典中。

著录项

  • 公开/公告号US2005197829A1

    专利类型

  • 公开/公告日2005-09-08

    原文格式PDF

  • 申请/专利权人 KAORU OKUMURA;

    申请/专利号US20040792443

  • 发明设计人 KAORU OKUMURA;

    申请日2004-03-03

  • 分类号G06F17/21;

  • 国家 US

  • 入库时间 2022-08-21 22:22:27

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号