首页> 中国专利> 基于机器学习的中文自动文摘方法

基于机器学习的中文自动文摘方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明提出了一种基于机器学习的中文自动文摘方法，包括：输入文本对文本并进行预处理；对预处理后的文本信息进行文本结构划分，将预处理后的文本划分为表征不同主题的多个意义段，并计算意义段重要度和段落重要度；对预处理后的文本进行概念获取，将文本中的所有词语表示转换为概念表示，并计算概念重要度、概念的频度、概念的位置；根据对文本划分的结构信息、概念的频度、概念的位置、段落重要度、意义段重要度计算得到句子的重要度；从各个意义段中抽取重要度大于预设值的句子；将上述重要度大于预设值的句子按照原文顺序排列，作为文摘结果进行输出。本发明可以实现对中文文本的自动摘要生成。

著录项

公开/公告号CN106126620A

专利类型发明专利
公开/公告日2016-11-16

原文格式PDF
申请/专利权人北京鼎泰智源科技有限公司;
展开▼

申请/专利号CN201610458304.1
发明设计人高强;曹志松;顾海英;
展开▼

申请日2016-06-22
分类号G06F17/30(20060101);
代理机构北京中企鸿阳知识产权代理事务所(普通合伙);
代理人刘葛;郭鸿雁
地址 100085 北京市海淀区上地信息路7号数字传媒大厦1号楼401室
入库时间 2023-06-19 00:53:35

法律信息

法律状态公告日

法律状态信息

法律状态
2017-04-05

实质审查的生效 IPC(主分类):G06F17/30 申请日:20160622

实质审查的生效
2016-11-16

公开

公开

相似文献

专利
中文文献
外文文献

1. 基于机器学习的中文自动文摘方法 [P] . 中国专利： CN106126620A . 2016-11-16
2. 一种基于云模型的中文面向查询的多文档自动文摘方法 [P] . 中国专利： CN102411621A . 2012-04-11
3. Method and System for Effective Detection of Ransomware using Machine Learning based on Entropy of File in Backup System [P] . KR102258910B1 . 2021-06-01

机译：基于备份系统中文件熵的机器学习有效地检测勒索软件的方法和系统
4. MACHINE LEARNING-BASED CHINESE WORD SEGMENTATION APPARATUS [P] . 韩国专利： KR20170088169A . 2017-08-01

机译：基于机器学习的中文分词装置
5. ARTIFACT REMOVAL METHOD AND APPARATUS BASED ON MACHINE LEARNING, AND METHOD AND APPARATUS FOR TRAINING ARTIFACT REMOVAL MODEL BASED ON MACHINE LEARNING [P] . US2022038749A1 . 2022-02-03

机译：基于机器学习的工件去除方法和装置，以及基于机器学习的艺术移除模型的方法和装置