首页> 中国专利> 文档内容导出方法、导出装置、电子设备及存储介质

文档内容导出方法、导出装置、电子设备及存储介质

摘要

本发明实施例提供了一种文档内容导出方法、导出装置、电子设备及存储介质,其中方法包括:从待处理文档中获取第一内容,第一内容在待处理文档中具有预设标识,第一内容包括:文本内容,公式内容,或者图片内容;基于第一内容,以及第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,文档符号用于标识句子或者段落结束;导出第二内容。本发明实施例能够解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。

著录项

  • 公开/公告号CN112307716A

    专利类型发明专利

  • 公开/公告日2021-02-02

    原文格式PDF

  • 申请/专利号CN201910676712.8

  • 发明设计人 欧振羽;

    申请日2019-07-25

  • 分类号G06F40/117(20200101);G06F40/169(20200101);

  • 代理机构11413 北京柏杉松知识产权代理事务所(普通合伙);

  • 代理人丁芸;马敬

  • 地址 519015 广东省珠海市高新区唐家湾镇前岛环路321号金山软件园5号楼

  • 入库时间 2023-06-19 09:44:49

说明书

技术领域

本发明涉及办公软件技术领域,特别是涉及一种文档内容导出方法、导出装置、电子设备及存储介质。

背景技术

日常工作中,人们在阅读文档时,经常需要对文档中的一些重要的内容做标识,例如,对这些内容高亮显示或者添加下划线,然后将这些具有标识的内容导出生成一个新文档,便于快速查询这些内容。

现有技术中,用户在使用导出重点内容的功能后,系统通常仅仅将具有标识的内容导出,具体过程为:系统首先按照文档的阅读顺序,依次查找文档中具有标识的内容,由于这些标识均是预设的,因此系统可以直接查找到文档中具有标识的内容,然后将这些具有标识的内容导出,生成一个包含这些内容的新文档,例如,如果文档中具有标识的内容为关键词,则系统导出的也为关键词;如果文档中具有标识的内容为句子,则系统导出的也为句子。

但是,现有的文档重点内容导出方法,只能导出具有标识的内容,即,标识什么,则导出什么,因此导出的内容容易因脱离上下文关系而难于理解,导致用户阅读体验不佳。

发明内容

本发明实施例的目的在于提供一种文档内容导出方法、导出装置、电子设备及存储介质,以解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。具体技术方案如下:

第一方面,本发明实施例提供了一种文档内容导出方法,所述方法包括:

从待处理文档中获取第一内容,所述第一内容在所述待处理文档中具有预设标识,所述第一内容包括:文本内容,公式内容,或者图片内容;

基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容,所述第二内容为包括所述第一内容的句子或段落,所述文档符号用于标识句子或者段落结束;

导出所述第二内容。

可选地,所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:

基于所述第一内容,以及所述第一内容的前后文中与所述第一内容之间的字数最少的所述文档符号,确定所述第二内容。

可选地,在所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容之前,所述方法还包括:

获取用户针对第一选择界面中各预设选择项的第一选择结果,所述第一选择界面中设置有针对不同导出方式的选择项,所述导出方式包括:导出整句内容,以及导出整段内容;

所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:

根据所述第一选择结果所确定的导出方式,在所述待处理文档中确定位于所述第一内容之前的文本内容的第一符号,以及确定位于所述第一内容之后的文本内容的第二符号;

确定所述第一符号和所述第二符号之间的内容为所述第二内容。

可选地,所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:

在所述待处理文档中,以所述第一内容的第一个字符作为第一起始查找点,向前查找与所述第一内容之间的字数最少的文档符号,作为所述第一符号;

在所述待处理文档中,以所述第一内容的最后一个字符作为第二起始查找点,向后查找与所述第一内容之间的字数最少的文档符号,作为所述第二符号;

将所述第一符号与所述第二符号之间的内容,确定为所述第二内容。

可选地,在所述从待处理文档中获取第一内容之前,所述方法还包括:

获取用户针对第二选择界面中各预设选择项的第二选择结果,所述第二选择界面中设置有针对不同预设标识的选择项;

所述导出所述第二内容的步骤,包括:

根据所述第二选择结果所确定的不同预设标识,导出多个第二内容,所述多个第二内容中包括:具有不同预设标识的第一内容所对应的第二内容。

可选地,在所述导出所述第二内容之前,所述方法还包括:

获取用户针对第三选择界面中各预设选择项的第三选择结果,所述第三选择界面中设置有是否导出所述待处理文档的目录的选择项;

所述导出所述第二内容的步骤,包括:

从所述待处理文档的预设存储结构信息中获取所述待处理文档的目录,以及与所述目录中的各目录层级对应的节点标识,一个所述节点标识用于标识一个目录层级;

确定在所述待处理文档中位于所述第二内容之前,且与所述第二内容之间的字数最少的节点标识;

根据所确定的所述节点标识,确定所述第二内容与所述目录层级的对应关系;

根据所述对应关系,将所述第二内容添加至与所述第二内容对应的目录层级下,并将所述第二内容和所述目录共同导出。

可选地,所述从待处理文档中获取第一内容的步骤,包括:

从所述待处理文档中获取多个所述第一内容;

所述基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容的步骤,包括:

分别根据多个所述第一内容,以及所述第一内容的前后文的所述文档符号,确定每个与所述第一内容对应的所述第二内容;

当存在多个相同的第二内容时,保留所述多个相同的第二内容中的一个第二内容,并将所述多个相同的第二内容中的其他第二内容删除;

当不存在所述多个相同的第二内容时,执行所述导出所述第二内容的步骤。

第二方面,本发明实施例提供了一种文档内容导出装置,所述装置包括:

第一获取模块,用于从待处理文档中获取第一内容,所述第一内容在所述待处理文档中具有预设标识,所述第一内容包括:文本内容,公式内容,或者图片内容;

确定模块,用于基于所述第一内容,以及所述第一内容的前后文的文档符号,确定第二内容,所述第二内容为包括所述第一内容的句子或段落,所述文档符号用于标识句子或者段落结束;

导出模块,用于导出所述第二内容。

可选地,所述确定模块具体用于:

基于所述第一内容,以及所述第一内容的前后文中与所述第一内容之间的字数最少的所述文档符号,确定所述第二内容。

可选地,所述装置还包括:

第二获取模块,用于获取用户针对第一选择界面中各预设选择项的第一选择结果,所述第一选择界面中设置有针对不同导出方式的选择项,所述导出方式包括:导出整句内容,以及导出整段内容;

所述确定模块包括:

第一确定子模块,用于根据所述第一选择结果所确定的导出方式,在所述待处理文档中确定位于所述第一内容之前的文本内容的第一符号,以及确定位于所述第一内容之后的文本内容的第二符号;

第二确定子模块,用于确定所述第一符号和所述第二符号之间的内容为所述第二内容。

可选地,所述确定模块,包括:

第一查找子模块,用于在所述待处理文档中,以所述第一内容的第一个字符作为第一起始查找点,向前查找与所述第一内容之间的字数最少的文档符号,作为所述第一符号;

第二查找子模块,用于在所述待处理文档中,以所述第一内容的最后一个字符作为第二起始查找点,向后查找与所述第一内容之间的字数最少的文档符号,作为所述第二符号;

第三确定子模块,用于将所述第一符号与所述第二符号之间的内容,确定为所述第二内容。

可选地,所述装置还包括:

第三获取模块,用于获取用户针对第二选择界面中各预设选择项的第二选择结果,所述第二选择界面中设置有针对不同预设标识的选择项;

所述导出模块,具体用于:

根据所述第二选择结果所确定的不同预设标识,导出多个第二内容,所述多个第二内容中包括:具有不同预设标识的第一内容所对应的第二内容。

可选地,所述装置还包括:

第四获取模块,用于获取用户针对第三选择界面中各预设选择项的第三选择结果,所述第三选择界面中设置有是否导出所述待处理文档的目录的选择项;

所述导出模块包括:

获取子模块,用于从所述待处理文档的预设存储结构信息中获取所述待处理文档的目录,以及与所述目录中的各目录层级对应的节点标识,一个所述节点标识用于标识一个目录层级;

第四确定子模块,用于确定在所述待处理文档中位于所述第二内容之前,且与所述第二内容之间的字数最少的节点标识;

第五确定子模块,用于根据所确定的所述节点标识,确定所述第二内容与所述目录层级的对应关系;

添加子模块,用于根据所述对应关系,将所述第二内容添加至与所述第二内容对应的目录层级下,并将所述第二内容和所述目录共同导出。

可选地,所述第一获取模块,具体用于:

从所述待处理文档中获取多个所述第一内容;

所述确定模块,包括:

第六确定子模块,用于分别根据多个所述第一内容,以及所述第一内容的前后文的所述文档符号,确定每个与所述第一内容对应的所述第二内容;

处理子模块,用于当存在多个相同的第二内容时,保留所述多个相同的第二内容中的一个第二内容,并将所述多个相同的第二内容中的其他第二内容删除;

触发子模块,用于当不存在所述多个相同的第二内容时,触发所述导出模块执行所述导出所述第二内容的步骤。

第三方面,本发明实施例提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口、所述存储器通过所述通信总线完成相互间的通信;所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现本发明实施例第一方面提供的文档内容导出方法的方法步骤。

第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行本发明实施例第一方面提供的文档内容导出方法的方法步骤。

本发明实施例提供的一种文档内容导出方法、导出装置、电子设备及存储介质,通过从待处理文档中获取第一内容,并基于第一内容,以及该第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,最后将第二内容导出。通过本发明实施例的文档导出方法,能够确定包括第一内容的句子或段落为第二内容,并将该第二内容导出,即,在导出第一内容的同时,将第一内容的前后文一并导出,以解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。因此,本发明实施例的文档导出方法使得将第二内容导出后生成的新文档的内容更加全面,便于用户在此基础上理解这些内容,而不需要重新翻看原文档,提高用户的阅读体验度。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的文档内容导出方法的一种流程示意图;

图2为本发明实施例提供的文档内容导出方法的另一种流程示意图;

图3为本发明实施例提供的文档内容导出方法中,步骤S102的流程示意图;

图4为本发明实施例提供的文档内容导出方法的第三种流程示意图;

图5为本发明实施例提供的文档内容导出方法的第四种流程示意图;

图6为本发明实施例提供的文档内容导出方法的第五种流程示意图;

图7为本发明实施例提供的文档内容导出装置的一种结构示意图;

图8为本发明实施例提供的文档内容导出装置的另一种结构示意图;

图9为本发明实施例提供的文档内容导出装置中确定模块的第一种结构示意图;

图10为本发明实施例提供的文档内容导出装置中确定模块的第二种结构示意图;

图11为本发明实施例提供的文档内容导出装置的第三种结构示意图;

图12为本发明实施例提供的文档内容导出装置的第四种结构示意图;

图13为本发明实施例提供的文档内容导出装置中导出模块的一种结构示意图;

图14为本发明实施例提供的文档内容导出装置中确定模块的第三种结构示意图;

图15为本发明实施例提供的电子设备的一种结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

有鉴如此,本发明实施例首先提供了一种文档内容导出方法,该方法可以应用于终端设备中,该终端设备例如可以为:电子计算机、平板电脑、智能手机等具有信息处理能力的电子设备。

如图1所示,本发明实施例提供了一种文档内容导出方法,该过程可以包括以下步骤:

S101,从待处理文档中获取第一内容。

在本发明实施例中,待处理文档可以为Word文档、PPT(PowerPoint,演示文稿)文档或者PDF(Portable Document Format,便携式文档格式)文档。只要用户可以在文档中的内容上添加预设标识,该类文档均可以采用本发明实施例提供的文档内容导出方法,导出第二内容。

第一内容在待处理文档中具有预设标识,该预设标识可以包括:高亮显示、添加下划线、斜体或者加粗等,只要该预设标识为待处理文档的标识库中具有的标识即可,当然,除所举的例子所示的实现方式以外,实现该特征的方式均属于本发明实施例的保护范围。

第一内容为用户在阅读待处理文档的过程中认为较为重要的内容,第一内容可以包括:文本内容,公式内容,或者图片内容。

S102,基于第一内容,以及第一内容的前后文的文档符号,确定第二内容。

在本发明实施例中,第二内容可以为包括第一内容的句子或段落。此处的句子可以指完整的一句话,其结尾通常为句号、问号或感叹号等标点符号,这些标点符号为句子结尾符号。段落可以指一整段话,其结尾通常为段落符号,例如在Word文档中,段落符号为回车符。

文档符号用于标识句子或者段落结束,因此,此处的文档符号可以为句号、问号或感叹号等句子结尾符号,或者,文档符号可以为段落符号。

作为本发明实施例可选的一种实施方式,本发明实施例步骤S102具体可以包括:

基于第一内容,以及第一内容的前后文中与第一内容之间的字数最少的文档符号,确定第二内容。

在本发明实施例中,第一内容的前后文可以指,在待处理文档中,位于第一内容之前和位于第一内容之后的内容。当文档符号为句号、问号或感叹号等句子结尾符号时,根据第一内容的前后文中与第一内容之间的字数最少的文档符号,即可确定待处理文档中,位于第一内容之前,且与第一内容之间的字数最少的文档符号应该为,第一内容所在句子的前一个句子的句子结尾符号;在待处理文档中,位于第一内容之后,且与第一内容之间的字数最少的文档符号应该为,第一内容所在句子的句子结尾符号。根据前一个句子的句子结尾符号和第一内容所在句子的句子结尾符号即可确定第二内容。

作为本发明实施例可选的一种实施方式,如图2所示,在本发明实施例S102之前,本发明实施例提供的文档内容导出方法还包括:

S201,获取用户针对第一选择界面中各预设选择项的第一选择结果。

在本发明实施例中,电子设备可以通过向用户展示第一选择界面,该第一选择界面中设置有针对不同导出方式的选择项,该导出方式可以包括:导出整句内容,以及导出整段内容。用户可以根据自己对第一内容的理解情况,选择导出方式。例如,当用户认为,需要通过包括第一内容的段落才能理解第一内容时,可以选择导出整段内容的选择项;当用户认为只需要通过包括第一内容的句子,便可以理解第一内容时,可以选择导出整句内容的选择项。

当电子设备获取到用户针对上述第一选择界面中各预设选择项的第一选择结果后,如图2所示,本发明实施例S102具体可以包括:

S10211,根据第一选择结果所确定的导出方式,在待处理文档中确定位于第一内容之前的文本内容的第一符号,以及确定位于第一内容之后的文本内容的第二符号。

当电子设备获取到的第一选择结果为导出整段内容时,可以在待处理文档中确定位于第一内容之前的文本内容的段落符号,该段落符号即为第一符号,可以在待处理文档中确定位于第一内容之后的文本内容的段落符号,该段落符号即为第二符号;当电子设备获取到的第一选择结果为导出整句内容时,可以在待处理文档中确定位于第一内容之前的文本内容的句子结尾符号,该句子结尾符号即为第一符号,并且可以在待处理文档中确定位于第一内容之后的文本内容的句子结尾符号,该句子结尾符号即为第二符号。

S10212,确定第一符号和第二符号之间的内容为第二内容。

位于第一内容之前的文本内容的段落符号,和位于第一内容之后的文本内容的段落符号,两者之间的内容即为包括第一内容的段落;位于第一内容之前的文本内容的句子结尾符号,和位于第一内容之后的文本内容的句子结尾符号,两者之间的内容即为包括第一内容的句子。

需要说明的是,导出方式还可以包括导出仅第一内容,当用户认为仅将第一内容导出后,便可以理解第一内容,而无需将第一内容的前后文一并导出,则可以选择该导出仅第一内容选择项。电子设备在获取到第一选择结果为导出仅第一内容后,直接将第一内容导出。

采用上述的技术方案,可以为用户提供针对不同导出方式的选择项,使得用户可以根据自己的实际需求进行相应的选择,电子设备将根据用户针对不同导出方式的选择项的选择结果,导出与用户期望的导出方式相符的内容。因此,本技术方案可以进一步满足用户的需求。

作为本发明实施例可选的一种实施方式,如图3所示,本发明实施例步骤S102具体可以包括:

S10221,在待处理文档中,以第一内容的第一个字符作为第一起始查找点,向前查找与第一内容之间的字数最少的文档符号,作为第一符号。

当第二内容为句子时,可以在待处理文档中,以第一内容的第一个字符作为第一起始查找点,向前查找与第一内容之间的字数最少的句子结尾符号,所查找到的句子结尾符号为第一内容所在句子的前一个句子的句子结尾符号,该句子结尾符号即为第一符号。

S10222,在待处理文档中,以第一内容的最后一个字符作为第二起始查找点,向后查找与第一内容之间的字数最少的文档符号,作为第二符号。

可以在待处理文档中,以第一内容的最后一个字符作为第二起始查找点,向后查找与第一内容之间的字数最少的句子结尾符号,所查找到的句子结尾符号为第一内容所在句子的句子结尾符号,该句子结尾符号即为第二符号。

S10223,将第一符号与第二符号之间的内容,确定为第二内容。

第一内容所在句子的前一个句子的句子结尾符号,和第一内容所在句子的句子结尾符号之间的内容,即为第一内容所在的句子,也即为第二内容。通过上述步骤S10221~S10223的方法流程,能够快速确定第二内容。

作为本发明实施例可选的一种实施方式,如图4所示,本发明实施例步骤S101具体可以包括:

S1011,从待处理文档中获取多个第一内容。

由于用户在阅读待处理文档时,可能需要在多个第一内容上添加预设标识,因此可以获取多个第一内容。

当获取到多个第一内容时,如图4所示,本发明实施例的步骤S102,具体可以包括:

S10231,分别根据多个第一内容,以及第一内容的前后文的文档符号,确定每个与第一内容对应的第二内容。

首先可以确定与每一个第一内容对应的第二内容,其具体确定第二内容的方法可以参考图3所示的步骤S10221~S10223,该第二内容可以为包括第一内容的句子或者段落。

S10232,当存在多个相同的第二内容时,保留多个相同的第二内容中的一个第二内容,并将多个相同的第二内容中的其他第二内容删除。

当第二内容为句子时,可能存在多个第一内容在待处理文档中,位于同一个句子中的情况,因此与多个第一内容对应的第二内容均为相同的句子。可以通过判断是否存在多个相同的第二内容,如果存在相同的第二内容,则可以包括所有相同的第二内容中的一个第二内容,并将其中的其他第二内容删除,以确保导出的所有第二内容中不存在完全相同的两个第二内容。

S10233,当不存在多个相同的第二内容时,执行导出第二内容的步骤。

如果所有第二内容中均不存在相同的第二内容,则可以将所有第二内容导出。

采用上述的技术方案,通过判断是否存在相同的第二内容,如果存在相同的第二内容,则保留所有相同的第二内容中的一个第二内容,将其他第二内容删除,避免了当多个第一内容位于一个句子中,或者位于一个段落中,而使得与多个第一内容对应的第二内容均相同,最终导出的新文档中存在多个相同的第二内容的情况,因此,上述技术方案能够进一步增加用户的阅读体验度。

参见图1,S103,导出第二内容。

当只有一个第二内容时,则将该第二内容导出并生成新文档;如果有多个第二内容时,则将所有第二内容导出后,在每一个第二内容之后添加一个回车符并生成新文档。

作为本发明实施例可选的一种实施方式,如图5所示,在本发明实施例S101之前,本发明实施例提供的文档内容导出方法还包括:

S301,获取用户针对第二选择界面中各预设选择项的第二选择结果。

在本发明实施例中,电子设备可以通过向用户展示第二选择界面,该第二选择界面中设置有针对不同预设标识的选择项。例如,可以在该预设选择项中设置高亮显示、添加下划线、斜体或者加粗等,该预设选择项可以按照用户的标注习惯以及待处理文档的文档类型进行设置,例如,当待处理文档为PDF文档时,由于PDF文档中的预设标识只有高亮显示、添加下划线以及添加删除线等,因此可以将这三种预设标识作为三个选择项设置在第二选择界面中。又例如,当待处理文档为Word文档时,由于Word文档中的预设标识较多,但是用户为了使第一内容与待处理文档中的其他内容的区别较为明显,通常可能会选择高亮显示,或者更改文档内容的颜色等方式,因此对于Word文档,可以将这两种预设标识作为两个选择项设置在第二选择界面中。

当电子设备获取到用户针对不同预设标识的选择项后,如图5所示,本发明实施例S103具体可以包括:

S10311,根据第二选择结果所确定的不同预设标识,导出多个第二内容。

在本发明实施例中,多个第二内容中包括:具有不同预设标识的第一内容所对应的第二内容。

当用户只选择其中的一种预设标识的选择项时,电子设备只需要将与具有该种预设标识的第一内容对应的第二内容导出;当用户选择了多个预设标识的选择项时,例如,用户同时选择了高亮显示和加粗时,电子设备需要确定与高亮显示的第一内容对应的第二内容,以及与加粗的第一内容对应的第二内容,并将这两个第二内容均导出。

通常情况下,当待处理文档中包含了多方面的知识,用户对于不同方面的知识添加不同的预设标识。因此,该种情况下,上述技术方案可以为用户提供针对多个不同预设标识的选择项,当用户只需要其中的一个方面的知识时,可以选择与该方面知识相对应的预设标识,则电子设备只将该方面的知识导出;当用户需要多个方面的知识时,可以通过选择多个预设标识,此时电子设备将这多个方面的知识同时导出至一个新文档中,用户还可以通过每次选择不同的预设标识,并导出生成一个新文档,进而将不同方面的知识分别导出在不同的新文档中。因此,采用上述的方案,可以使得用户根据自己的实际需求进行选择,因此进一步提高用户的阅读体验度。

作为本发明实施例可选的一种实施方式,如图6所示,在本发明实施例S103之前,本发明实施例提供的文档内容导出方法还包括:

S401,获取用户针对第三选择界面中各预设选择项的第三选择结果。

在本发明实施例中,电子设备可以向用户展示第三选择界面,第三选择界面中设置有是否导出待处理文档的目录的选择项,该预设选择项通常可以设置为是和否两个选择项,以供用户选择。

当获取到的用户针对第三选择界面中的第三选择结果为是,即用户希望导出待处理文档的目录时,如图6所示,本发明实施例的步骤S103具体可以包括:

S10321,从待处理文档的预设存储结构信息中获取待处理文档的目录,以及与目录中的各目录层级对应的节点标识。

通常预设存储结构信息中包括有文档内容、目录和文档属性等于文档有关的信息,因此可以从待处理文档的预设存储结构信息中获取待处理文档的目录,以及与目录中的各个目录层级对应的节点标识。在本发明实施例中,一个节点标识用于标识一个目录层级,例如对于Word文档来说,该节点标识可以为,每个目录层级结尾的段落符号。

S10322,确定在待处理文档中位于第二内容之前,且与第二内容之间的字数最少的节点标识。

具体确定方法可以为,从第二内容的第一个字符向前查找与第二内容之间的字数最少的节点标识,将所查找到的该节点标识确定为第二内容所在目录层级对应的节点标识。当存在多个第二内容时,可以按照上述方法分别确定与每个第二内容对应的节点标识。

S10323,根据所确定的节点标识,确定第二内容与目录层级的对应关系。

可以根据每个第二内容对应的节点标识,确定与每个第二内容对应的目录层级,进而确定每个第二内容与目录层级之间的对应关系。

S10324,根据对应关系,将第二内容添加至与第二内容对应的目录层级下,并将第二内容和目录共同导出。

可以根据第二内容与目录层级之间的对应关系,将每个第二内容分别添加至与每个第二内容对应的目录层级下,并将第二内容和目录共同导出。

采用上述的技术方案,可以通过为用户提供是否导出目录的选择项,并让用户根据自己的需求选择是否需要导出目录,如果用户认为待处理文档中的内容较少而不需要目录时,可以通过选择否,则电子设备仅将第二内容导出;如果用户认为在导出第二内容后生成的新文档中,阅读第二内容时,还可能存在不能完全理解该第二内容,或者还想要查看待处理文档中位于该第二内容前后文的内容时,通过选择是,电子设备则将目录与第二内容共同导出,使得用户根据该目录,即可在待处理文档中快速查找到第二内容,并翻看其前后文的内容,便于更好地理解该第二内容。因此上述技术方案可以进一步满足客户的需求。

本发明实施例提供的一种文档内容导出方法,通过从待处理文档中获取第一内容,并基于第一内容,以及该第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,最后将第二内容导出。通过本发明实施例的文档导出方法,能够确定包括第一内容的句子或段落为第二内容,并将该第二内容导出,即,在导出第一内容的同时,将第一内容的前后文一并导出,以解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。因此,本发明实施例的文档导出方法使得将第二内容导出后生成的新文档的内容更加全面,便于用户在此基础上理解这些内容,而不需要重新翻看原文档,提高用户的阅读体验度。

本发明实施例提供的一种文档内容导出装置的一种具体实施例,与图1所示流程相对应,参考图7,图7为本发明实施例的一种文档内容导出装置的一种结构示意图,包括:

第一获取模块501,用于从待处理文档中获取第一内容,第一内容在待处理文档中具有预设标识,第一内容包括:文本内容,公式内容,或者图片内容。

确定模块502,用于基于第一内容,以及第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,文档符号用于标识句子或者段落结束。

导出模块503,用于导出第二内容。

作为本发明实施例一种可选的实施方式,上述确定模块502,具体用于:

基于第一内容,以及第一内容的前后文中与第一内容之间的字数最少的文档符号,确定第二内容。

作为本发明实施例一种可选的实施方式,如图8所示,本发明实施例提供的文档内容导出装置还可以包括:

第二获取模块601,用于获取用户针对第一选择界面中各预设选择项的第一选择结果,第一选择界面中设置有针对不同导出方式的选择项,导出方式包括:导出整句内容,以及导出整段内容。

如图9所示,上述确定模块502可以包括:

第一确定子模块5021,用于根据第一选择结果所确定的导出方式,在待处理文档中确定位于第一内容之前的文本内容的第一符号,以及确定位于第一内容之后的文本内容的第二符号。

第二确定子模块5022,用于确定第一符号和第二符号之间的内容为第二内容。

作为本发明实施例一种可选的实施方式,如图10所示,上述确定模块502可以包括:

第一查找子模块5023,用于在待处理文档中,以第一内容的第一个字符作为第一起始查找点,向前查找与第一内容之间的字数最少的文档符号,作为第一符号。

第二查找子模块5024,用于在待处理文档中,以第一内容的最后一个字符作为第二起始查找点,向后查找与第一内容之间的字数最少的文档符号,作为第二符号。

第三确定子模块5025,用于将第一符号与第二符号之间的内容,确定为第二内容。

作为本发明实施例一种可选的实施方式,如图11所示,本发明实施例提供的文档内容导出装置还可以包括:

第三获取模块701,用于获取用户针对第二选择界面中各预设选择项的第二选择结果,第二选择界面中设置有针对不同预设标识的选择项。

则上述导出模块,具体用于:

根据第二选择结果所确定的不同预设标识,导出多个第二内容,多个第二内容中包括:具有不同预设标识的第一内容所对应的第二内容。

作为本发明实施例一种可选的实施方式,如图12所示,本发明实施例提供的文档内容导出装置还可以包括:

第四获取模块801,用于获取用户针对第三选择界面中各预设选择项的第三选择结果,第三选择界面中设置有是否导出待处理文档的目录的选择项。

如图13所示,上述导出模块503可以包括:

获取子模块5031,用于从待处理文档的预设存储结构信息中获取待处理文档的目录,以及与目录中的各目录层级对应的节点标识,一个节点标识用于标识一个目录层级。

第四确定子模块5032,用于确定在待处理文档中位于第二内容之前,且与第二内容之间的字数最少的节点标识。

第五确定子模块5033,用于根据所确定的节点标识,确定第二内容与目录层级的对应关系。

添加子模块5034,用于根据对应关系,将第二内容添加至与第二内容对应的目录层级下,并将第二内容和目录共同导出。

作为本发明实施例一种可选的实施方式,上述第一获取模块501,具体用于:从待处理文档中获取多个第一内容。

如图14所示,确定模块502可以包括:

第六确定子模块5026,用于分别根据多个第一内容,以及第一内容的前后文的文档符号,确定每个与第一内容对应的第二内容。

处理子模块5027,用于当存在多个相同的第二内容时,保留多个相同的第二内容中的一个第二内容,并将多个相同的第二内容中的其他第二内容删除。

触发子模块5028,用于当不存在多个相同的第二内容时,触发导出模块503执行导出第二内容的步骤。

本发明实施例提供的一种文档内容导出装置,通过从待处理文档中获取第一内容,并基于第一内容,以及该第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,最后将第二内容导出。通过本发明实施例的文档导出方法,能够确定包括第一内容的句子或段落为第二内容,并将该第二内容导出,即,在导出第一内容的同时,将第一内容的前后文一并导出,以解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。因此,本发明实施例的文档导出方法使得将第二内容导出后生成的新文档的内容更加全面,便于用户在此基础上理解这些内容,而不需要重新翻看原文档,提高用户的阅读体验度。

本发明实施例还提供了一种电子设备,如图15所示,包括处理器901、通信接口902、存储器903和通信总线904,其中,处理器901,通信接口902,存储器903通过通信总线904完成相互间的通信。

存储器903,用于存放计算机程序。

处理器901,用于执行存储器903上所存放的程序时,实现如下步骤:

从待处理文档中获取第一内容,第一内容在待处理文档中具有预设标识,第一内容包括:文本内容,公式内容,或者图片内容。

基于第一内容,以及第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,文档符号用于标识句子或者段落结束。

导出第二内容。

本发明实施例提供的一种电子设备,通过从待处理文档中获取第一内容,并基于第一内容,以及该第一内容的前后文的文档符号,确定第二内容,第二内容为包括第一内容的句子或段落,最后将第二内容导出。通过本发明实施例的文档导出方法,能够确定包括第一内容的句子或段落为第二内容,并将该第二内容导出,即,在导出第一内容的同时,将第一内容的前后文一并导出,以解决现有的文档内容导出方法只能导出具有标识的内容的技术问题。因此,本发明实施例的文档导出方法使得将第二内容导出后生成的新文档的内容更加全面,便于用户在此基础上理解这些内容,而不需要重新翻看原文档,提高用户的阅读体验度。

上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,简称PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,简称EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

通信接口用于上述电子设备与其他设备之间的通信。

存储器可以包括随机存取存储器(Random Access Memory,简称RAM),也可以包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。可选的,存储器还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(Network Processor,简称NP)等;还可以是数字信号处理器(Digital Signal Processing,简称DSP)、专用集成电路(Application SpecificIntegrated Circuit,简称ASIC)、现场可编程门阵列(Field-Programmable Gate Array,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

本发明实施例还提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,当其在计算机上运行时,使得计算机执行上述实施例中任一所述的文档内容导出方法。

对于装置/电子设备/存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

需要说明的是,本发明实施例的装置、电子设备及存储介质分别是应用上述文档内容导出方法的装置、电子设备及存储介质,则上述文档内容导出方法的所有实施例均适用于该装置、电子设备及存储介质,且均能达到相同或相似的有益效果。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号