首页> 外国专利> identification of words in japanese text by a computer system

identification of words in japanese text by a computer system

机译:用计算机系统识别日语文本中的单词

摘要

A word breaking facility operates to identify words within a Japanese text string. The word breaking facility performs morphological processing to identify postfix bound morphemes and prefix bound morphemes. The word breaking facility also performs opheme matching to identify likely stem characters. A scoring heuristic is applied to determine an optimal analysis that includes a postfix analysis, a stem analysis, and a prefix analysis. The morphological analyses are stored in an efficient compressed format to minimize the amount of memory they occupy and maximize the analysis speed. The morphological analyses of postfixes, stems, and prefixes is performed in a right-to-left fashion. The word breaking facility may be used in applications that demand identity of selection granularity, autosummarization applications, content indexing applications, and natural language processing applications.
机译:断词功能用于识别日语文本字符串中的词。分词工具执行词法处理,以识别后缀绑定词素和前缀绑定词素。分词工具还执行拼音匹配以识别可能的词干字符。应用评分试探法确定最佳分析,包括后缀分析,词干分析和前缀分析。形态分析以有效的压缩格式存储,以最小化它们占用的内存量并最大化分析速度。后缀,词根和前缀的形态分析以从右到左的方式进行。分词工具可用于需要选择粒度标识的应用程序,自动摘要应用程序,内容索引应用程序和自然语言处理应用程序中。

著录项

  • 公开/公告号DE69710459D1

    专利类型

  • 公开/公告日2002-03-21

    原文格式PDF

  • 申请/专利权人 MICROSOFT CORP. REDMOND;

    申请/专利号DE19976010459T

  • 发明设计人 HALSTEAD H.;SUZUKI HISAMI;

    申请日1997-06-25

  • 分类号G06F17/28;G06F17/27;

  • 国家 DE

  • 入库时间 2022-08-22 00:25:00

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号