首页> 外国专利> The method of automatic summarization using a computer unsegmented text in the language C ideographic writing system

The method of automatic summarization using a computer unsegmented text in the language C ideographic writing system

机译:在C语言表意文字书写系统中使用计算机未分段文本进行自动摘要的方法

摘要

1.method of automatic u0440u0435u0444u0435u0440u0438u0440u043eu0432u0430u043du0438u00a0 with the aid of computer u043du0435u0441u0435u0433u043cu0435u043du0442u0438u0440u043eu0432u0430u043du043du043eu0433u043e text u00a0u0437u044bu043au0435 with u0438u0434u0435u043eu0433u0440u0430u0444u0438u0447u0435u0441u043au043eu0439 system of writing, including the frequency and u0441u0435u0431u00a0 distribution methods u0434u043bu00a0 u043eu043fu0440u0435u0434u0435u043bu0435u043du0438u00a0 most meaningful units of text, on the basis of which the paper u0441u043eu0441u0442u0430u0432u043bu00a0u044eu0442 text u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 orderwhat as main elements analysis using signs of writing systems u0438u0434u0435u043eu0433u0440u0430u0444u0438u0447u0435u0441u043au0438u0445 u00a0u0437u044bu043au043eu0432 - characters, with each unit of text u0438u043du0434u0435u043au0441u0438u0440u0443u044eu0442, dr. u043bu00a0 each relative frequency estimate method in this text, and compare it with the frequency of this method in the general population.on the basis of u043eu0442u043du043eu0448u0435u043du0438u00a0 "u043eu0442u043du043eu0441u0438u0442u0435u043bu044cu043du0430u00a0 frequency in the text / u043eu0442u043du043eu0441u0438u0442u0435u043bu044cu043du0430u00a0 frequency in the general population (most are semantically u043eu043fu0440u0435u0434u0435u043bu00a0u044eu0442 semantic weight) u0438u043cu044bu0435 characters u0434u043bu00a0 the text, with u043fu0440u0435u0434u043bu043eu0436u0435u043du0438u00a0, the semantic weight characters above threshold u0437u043du0430u0447u0435u043du0438u00a0 (for example, the average u0437u043du0430u0447u0435u043du0438u00a0 u0434u043bu00a0 all of the proposals)consider the semantically meaningful and included in the abstract text.;2. method for u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 1, so that the threshold value specifies the user.;3. method for u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 1, so that further u0432u044bu0434u0435u043bu00a0u044eu0442 text based on the identification of sub headings for each part.;4. method for u043eu0442u043bu0438u0447u0430u044eu0449u0438u0439u0441u00a0 1, so that the u0432u044bu0434u0435u043bu00a0u044eu0442 u043fu0440u0435u0434u043bu043eu0436u0435u043du0438u00a0 containing facts (figures).
机译:1.借助计算机 u043d u0435 u0441 u0435 u0435 u0433 u043c u04340 u0435 u0444 u0435 u0440 u0438 u0440 u043e u0432 u0430 u043d u0438 u00a0 u043d u0442 u0438 u0440 u043e u0432 u0430 u043d u043d u043e u043e u0433 u043e文本 u00a0 u0437 u044b u043a u0435与 u0438 u0434 u0435 u043e u0433 u0440 u0444 u0438 u0447 u0435 u0441 u043a u043e u0439书写系统,包括频率和 u0441 u0435 u0431 u00a0分配方法 u0434 u043b u00a0 u043e u043f u0440 u0435 u0434 u0435 u043b u0435 u043d u0438 u00a0最有意义的文本单位,在此基础上,论文 u0441 u043e u0441 u0442 u0430 u0432 u043b u00a0 u044e u0442文本 u043e u0442 u043b u0438 u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0顺序使用书写系统的符号作为主要元素分析 u0438 u0434 u0435 u043e u0433 u0440 u0430 u0444 u0438 u0447 u0435 u0441 u043a u0438 u0445 u00a0 u0437 u044b u043a u043e u0432-字符,每个文本单位 u0438 u043d u 0434 u0435 u043a u0441 u0438 u0440 u0443 u044e u0442,博士。 u043b u00a0本文中的每种相对频率估算方法,并与该方法在一般人群中的频率进行比较。基于 u043e u0442 u043d u043e u0448 u0435 u043d u0438 u00a0 “ u043e u0442 u043d u043e u0441 u0438 u0442 u0435 u043b u044c u043d u0430 u00a0频率在文本 / u043e u0442 u043d u043d u043e u0441 u0438 u0442 u0435 一般人群中的u043b u044c u043d u0430 u00a0频率(在语义上大多数是 u043e u043f u0440 u0435 u0434 u0435 u043b u00a0 u044e u0442语义权重) u0438 u043c u044b u0435字符 u0434 u043b u00a0文本,其中 u043f u0440 u0435 u0434 u043b u043e u0436 u0435 u043d u0438 u00a0,语义权重字符高于阈值 u0437 u043d u0430 u0447 u0435 u043d u0438 u00a0(例如,所有提案的平均 u0437 u043d u0430 u0447 u0435 u043d u0438 u00a0 u0434 u043b u00a0)考虑了语义上有意义,并包含在抽象文本中。 2. u043e u0442 u043b u0438 u0447的方法 u0430 u044e u0449 u0438 u0439 u0441 u00a0 1,因此阈值指定了用户。; 3。 u043e u0442 u043b u0438 u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0 1的方法,以便进一步基于文本 u0432 u044b u0434 u0435 u043b u00a0 u044e u0442每个部分的子标题的标识; 4。 u043e u0442 u043b u0438 u0447 u0430 u044e u0449 u0438 u0439 u0441 u00a0 1的方法,因此 u0432 u044b u0434 u0435 u043b u00a0 u044e u0442 u043f u0440 u0435 u0434 u043b u043e u0436 u0435 u043d u0438 u00a0包含事实(数据)。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号