首页> 外国专利> DATA MINING PLATFORM FOR BIOINFORMATICS AND OTHER KNOWLEDGE DISCOVERY

DATA MINING PLATFORM FOR BIOINFORMATICS AND OTHER KNOWLEDGE DISCOVERY

机译:用于生物信息学和其他知识发现的数据挖掘平台

摘要

The data mining platform comprises a plurality of system modules, each formed from a plurality of components. Each module has an input data component, a data analysis engine for processing the input data, an output data component for outputting the results of the data analysis, and a web server to access and monitor the other modules within the unit and to provide communication to other units. Each module processes a different type of data, for example, a first module processes microarray (gene expression) data while a second module processes biomedical literature on the Internet for information supporting relationships between genes and diseases and gene functionality. In the preferred embodiment, the data analysis engine is a kernel-based learning machine, and in particular, one or more support vector machines (SVMs). The data analysis engine includes a pre-processing function for feature selection, for reducing the amount of data to be processed by selecting the optimum number of attributes, or “features”, relevant to the information to be discovered.
机译:数据挖掘平台包括多个系统模块,每个系统模块由多个组件组成。每个模块都有一个输入数据组件,一个用于处理输入数据的数据分析引擎,一个用于输出数据分析结果的输出数据组件以及一个Web服务器,用于访问和监视单元中的其他模块并提供与其他单位。每个模块处理不同类型的数据,例如,第一个模块处理微阵列(基因表达)数据,而第二个模块处理Internet上的生物医学文献,以获取支持基因与疾病和基因功能之间关系的信息。在优选实施例中,数据分析引擎是基于内核的学习机,尤其是一个或多个支持向量机(SVM)。数据分析引擎包括用于特征选择的预处理功能,用于通过选择与要发现的信息相关的最佳属性或“特征”数量来减少要处理的数据量。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号