首页> 外国专利> Ways to find information in unstructured text multidisciplinary MASSES

Ways to find information in unstructured text multidisciplinary MASSES

机译:在非结构化文本多学科质量中查找信息的方法

摘要

1.method of searching for information using the information search system, u0437u0430u043au043bu044eu0447u0430u044eu0449u0438u0439u0441u00a0 in terms of the query vector that has u043fu043eu0440u00a0u0434u043au043eu0432u044bu0435 rooms, u0437u0430u0447u0435 m search u043eu0441u0443u0449u0435u0441u0442u0432u043bu00a0u044eu0442 line in u043fu0430u043cu00a0u0442u044c computer document numbers, which are u0445u043eu0442u00a0 one query term vector.then u0437u0430u043du043eu0441u00a0u0442 in u043fu0430u043cu00a0u0442u044c computer the number of u0441u043eu0432u043fu0430u0432u0448u0438u0445 terms with terms of query and u043fu043eu0440u00a0u0434u043au043eu0432u044bu0435 non u0441u043eu0432u043fu0430u0432u0448u0438u0445 terms, then in u043fu0430u043cu00a0u0442u0438 computer documents sort on classes with equal number of u0441u043eu0432u043fu0430u0432u0448u0438u0445 u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 terms, so that within each class of shape classes (class index index j, nature u0438u0437u0443u044eu0449u0438u0435u0441u00a0 complete coincidence service termsthen u043eu043fu0440u0435u0434u0435u043bu00a0u044eu0442 number of documents (nij) in u043fu043eu0434u043au043bu0430u0441u0441u0435 index (i class index j, then the number of documents ((n) u043eu043fu0440u0435u0434u0435u043bu00a0u044eu0442 class j, then u043eu043fu0440u0435u0434u0435u043bu00a0u044eu0442 u0432u0435u0440u043eu00a0u0442u043du043eu0441u0442u044c background document for division i, subject belonging to class j,;then u043eu043fu0440u0435u0434u0435u043bu00a0u044eu0442 criterion for each class as u0434u043bu00a0;further u0440u0430u0441u0448u0438u0440u00a0u044eu0442 request, if the documents class with Hjmax u0441u043eu0434u0435u0440u0436u0430u0442u0441u00a0 new terms that u043eu0442u043du043eu0441u00a0u0442u0441u00a0 to topic search.;2. method for u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 1, so that the information retrieval system u0437u0430u0433u0440u0443u0436u0430u044eu0442u0441u00a0 papers presented at the natural u00a0u0437u044bu043au0435.;3. method for u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 2, so that the formation of classes and subclasses u043eu0441u0443u0449u0435u0441u0442u0432u043bu00a0u0435u0442u0441u00a0 documents automatically.;4. method for 1, 2, or 3, u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 so that the number of terms in the query vector u043du0430u0445u043eu0434u0438u0442u0441u00a0 ranging from 10 to 1000.
机译:1.使用信息搜索系统 u0437 u0430 u043a u043b u044e u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0来搜索具有 u043f u043e u0440 u00a0 u0434 u043a u043e u0432 u044b u0435个房间, u0437 u0430 u0447 u0435 m搜索 u043e u0441 u0443 u0449 u0435 u0431 u0441 u0442 u0432 u043b u00a0 u043f u0430 u043c u00a0 u0442 u044c计算机文档编号中的u044e u0442行,即 u0445 u043e u0442 u00a0一个查询字词向量,然后 u0437 u0430 u0430 u043d u043e u0441 u00a0 u043f u0430 u043c u00a0 u0442 u044c计算机中的u0442编号 u0441 u043e u0432 u043f u0430 u0432 u0448 u0438 u0445带有查询条件的字词和 u043f u043e u0440 u0040 u0434 u043a u043e u0432 u044b u0435非 u0441 u043e u0432 u043f u04f u0430 u0432 u0448 u0438 u0445术语,然后以 u043f u0430 u043c u00a0 u0442 u0438计算机文档排序在等号 u0441 u043e u0432 u043f u0430 u0432 u0448 u0438 u0445 u043e u0442 u043b u0438 u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0项,以便在每个形状类类别(类索引索引j,性质 u0438 u0437 u0443 u044e u0449 u0438 u0435 u0441 u00a0完整的重合服务条款,然后 u043e u043f u0440 u0435 u0434 u0435 u043b u00a0 u044e u0442 u043f u043e u0434 u043a u043b u0430 u0441 u0441 u0435索引中的文档数(nij) (i类索引j,然后是文档数((n) u043e u043f u0440 u0435 u0434 u0435 u043b u00a0 u044e u0442类j,然后是 u043e u043f u0440 u0435 u0434 u0435 u043b u00a0 u044e u0442 u0432 u0435 u0440 u043e u00a0 u0442 u043d u043e u0441 u0442 u044c属于第i类的背景文档,然后属于j类;然后 u043e u043f u0440 u0435 u0434 u0435 u043b u00a0 u044e u0442每个类别的条件为 u0434 u043b u00a0;进一步的 u0440 u0430 u0441 u0448 u0438 u0440 u00a0 u044e u0442请求,如果具有Hjmax u0441 u043e u0434 u0435 u0440 u0436 u0430 u0442 u0441 u00a0的新术语的文档类 u043e u0442 u043d u043e u0441 u00a0 u0442 u0441 u00a0进行主题搜索; 2。 u043e u0442 u043b u0438 u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0 1的方法,因此信息检索系统 u0437 u0430 u0433 u0440 u0443 u0436 u0430 u044e u0442 u0441 u00a0在自然 u00a0 u0437 u044b u043a u0435上发表的论文。; 3。 u043e u0442 u043b u0438 u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0 2的方法,这样就形成了类和子类 u043e u0441 u0443 u0443 u0449 u0435 u0441 u0442 u0432 u043b u00a0 u0435 u0442 u0441 u00a0自动文件; 4。 1、2或3的方法, u043e u0442 u043b u0438 u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0,以便查询向量 u043d u0430 u0445 中的项数u043e u0434 u0438 u0442 u0441 u00a0,范围从10到1000。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号