首页> 外国专利> MACHINE LEARNING-BASED CHINESE WORD SEGMENTATION APPARATUS

MACHINE LEARNING-BASED CHINESE WORD SEGMENTATION APPARATUS

机译:基于机器学习的中文分词装置

摘要

The objective of the present invention is to provide a machine learning-based Chinese word segmentation apparatus capable of segmenting words in a Chinese sentence by using a hybrid method of combining a machine learning-based method and a heuristic-based longest matching method. To this end, the machine learning-based Chinese word segmentation apparatus comprises: a feature extraction part extracting features to be used for both machine learning and word segmentation; a machine learning part generating a learning model depending on a result of the machine learning; and a word segmentation part segmenting words in a Chinese sentence by using the features extracted in the feature extraction part and the learning model, wherein the feature extraction part uses a heuristic-based method, a method for using context as a feature, and a method for using linguistic characteristics as a feature.;COPYRIGHT KIPO 2017
机译:本发明的目的是提供一种基于机器学习的中文分词设备,该设备能够通过使用结合了基于机器学习的方法和基于启发式的最长匹配方法的混合方法来分割中文句子中的单词。为此,基于机器学习的中文分词装置包括:特征提取部分,其提取要用于机器学习和分词的特征;机器学习部分根据机器学习的结果生成学习模型;单词分割部,其特征在于,特征提取部使用基于启发式的方法,以上下文为特征的方法,使用语言特征作为特征。; COPYRIGHT KIPO 2017

著录项

  • 公开/公告号KR20170088169A

    专利类型

  • 公开/公告日2017-08-01

    原文格式PDF

  • 申请/专利号KR20160008173

  • 发明设计人 JIN YUNKR;

    申请日2016-01-22

  • 分类号G06F17/27;G06F15/18;

  • 国家 KR

  • 入库时间 2022-08-21 13:26:55

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号