大数据中对目标信息的准确查询,能够为信息分析提供更多的信息资源保障和技术支持.对大数据中目标信息的查询,需要对原始目标信息特征空间进行降维,给出目标信息码本阈值,完成对信息准确的查询.传统方法先给出分布式乘积量化模型的形式化定义,利用训练出的码本模型对分布式数据进行编码,但忽略了对原始数据进行降维处理,导致查询效果不理想.提出基于哈希的大数据中目标信息准确查询方法.提取目标信息的特征,给出信息间的相似性关系,获取两个相关矩阵的归一化的内积,得到基于目标信息字面上的词项的相似度,通过主成分分析理论对原始目标信息特征空间进行降维,利用哈希理论构成了目标信息原始向量的哈希编码,给出训练出的目标信息码本阈值,利用该阈值完成对目标信息准确查询.仿真证明,所提方法查询精度较高,大幅度提升了信息查询的质量.%An accurate query method for target information in big data is propose based on Hash.First of all,the target information feature is extracted and similarly relation in information is given,thus normalization transvection of two related matrices and similarity of lexical item in literal are obtained based on target information,and then dimensionality reduction for feature space of original target information is carried out by theory of principal component analysis and Hash code of original vector of target information is formed via Hash theory to give codebook threshold of target information trained.At last,the accurate query of target information is achieved by utilizing the threshold.The simulation results show that the mentioned method has high query accuracy.It can greatly improve quality of information inquiry.
展开▼
机译:释放气体放射性废物的授权。 Centrale Gravelines公共查询。调查文件。注释。气象数据的准确性足够。判决废止。在文本中不需要的初步研究中需要分析气体和液体排放的累积影响。单独的程序。需要重复初步研究的所有要素(否)。影响研究。内容。天然放射性的测量。分析效果,选择位置的原因。足够的细节。该法令的内容。拒绝条款。条款和条件仅适用于正常操作条件。合法性(是)。缺少关于测量和分析实验室现场是否存在的明确规定。违法(否)。 1976年8月10日法令所定义的一般要求。 (第44-670号)。