首页> 中国专利> 一种基于文本自身产生词库的分词方法及系统

一种基于文本自身产生词库的分词方法及系统

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明涉及一种基于文本自身产生词库的分词方法及系统，属于文本分析技术领域。本发明针对在没有明确的已知的字典前提下，通过待处理文本本身的文字关联程度，提取出词典，并依次筛选出待处理文本中可能的词语信息。同时，本发明提高了对未知文本信息的分词速度，满足了对实际未知文本无已知字典情况下的分词应用的实际需要。

著录项

公开/公告号CN109002460A

专利类型发明专利
公开/公告日2018-12-14

原文格式PDF
申请/专利权人昆明理工大学;
展开▼

申请/专利号CN201810554887.7
发明设计人邵玉斌;高凌云志;张琪;
展开▼

申请日2018-06-01
分类号G06F17/30(20060101);G06F17/22(20060101);G06F17/27(20060101);
代理机构
代理人
地址 650093 云南省昆明市五华区学府路253号
入库时间 2023-06-19 07:43:27

法律信息

法律状态公告日

法律状态信息

法律状态
2018-12-14

公开

公开

相似文献

专利
中文文献
外文文献

1. 一种基于文本自身产生词库的分词方法及系统 [P] . 中国专利： CN109002460A . 2018-12-14
2. 一种基于文本分词的离职预测方法及系统 [P] . 中国专利： CN111489030A . 2020-08-04
3. The system and method based on computer for the development of monolingual documents systems based computer to translate text input in language source for a foreign language and to desInvolvement of documents mono and multilingual translation method based on the computer to translate the text in the language source for a language estrageira method based on computer for developmentThe documents mono and multilingual translation and domain model tripartite [P] . BR9307175A . 1999-03-30

机译：用于开发单语文档的基于计算机的系统和方法基于计算机的系统，用于翻译外语源中的文本输入，并且基于计算机的单，多语翻译方法涉及用于翻译语言源中的文本的计算机。一种基于计算机的语言开发方法用于文档开发单，多语言翻译和领域模型三方
4. A READABLILTY INDEXING SYSTEM BASED ON LEXICAL DIFFICULTY AND THESAURUS [P] . 韩国专利： KR20050122571A . 2005-12-29

机译：一种基于词法难度和同义词库的可恢复性索引系统
5. WORD SEGMENTATION METHOD AND SYSTEM FOR LANGUAGE TEXT [P] . 欧洲知识产权局专利： EP3416064A4 . 2019-04-03

机译：语言文本的分词方法及系统