首页> 外国专利> SYSTEM FOR FORMING linguistic data retrieval and analysis of text documents

SYSTEM FOR FORMING linguistic data retrieval and analysis of text documents

机译:文本文件语言数据检索和分析系统

摘要

The invention relates to the field of computer engineering, in particular, to systems for forming linguistic data search and analysis of textual documents. The technical result is to increase the accuracy of semantic search and analysis of textual information as a result of the use of the relevant documents and sample documents found sets of vocabulary of the document with different minimum allowable value of the relative frequency of word usage. The technical result is achieved in that the system comprises a receiving unit array text code words, the module control sample source code module constructing frequency dictionary and corpus of text and a separate module forming subsets analyzed vocabulary of documents differing minimum allowable values ​​of the relative frequency of usage. 6 yl.
机译:本发明涉及计算机工程领域,尤其涉及用于形成文本文档的语言数据搜索和分析的系统。技术结果是由于使用相关文档和样本文档而发现的文档词汇集具有不同的单词使用相对频率的最小允许值,从而提高了语义搜索和文本信息分析的准确性。通过该系统实现了技术结果,该系统包括接收单元阵列文本代码字,构建频率字典和文本语料库的模块控制样本源代码模块以及形成不同的最小允许值的文档词汇的子集的单独模块。相对使用频率。 6 yl。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号