公开/公告号CN116881439A
专利类型发明专利
公开/公告日2023-10-13
原文格式PDF
申请/专利权人 福州佳软软件技术有限公司;
申请/专利号CN202310791125.X
申请日2023-06-30
分类号G06F16/34(2019.01);G06F16/335(2019.01);
代理机构
代理人
地址 350015 福建省福州市马尾区马尾图书馆第四层(自贸试验区内)
入库时间 2024-04-18 19:44:28
法律状态公告日
法律状态信息
法律状态
2023-10-31
实质审查的生效 IPC(主分类):G06F16/34 专利申请号:202310791125X 申请日:20230630
实质审查的生效
技术领域
本申请涉及电子书阅读技术领域,尤其是涉及一种小说剧情回顾生成方法、电子设备及存储介质。
背景技术
随着科技的发展,电子书阅读逐渐成为流行。区别于以纸张为载体的传统出版物,电子书利用计算机技术将一定的文字、图片、声音、影像等信息,通过数码方式记录在以光、电、磁为介质的设备中,并借助于特定的设备来读取、复制、传输。读者在进行电子书阅读时,有时由于两次阅读间隔时间较长,会忘记前面的剧情内容,导致阅读时容易产生不连贯的感觉,影响阅读体验。尤其是还处于连载当中的小说,读者需要等待作者更新,使得以上问题尤为明显。
现有的做法,一般是在小说详情页展示人工撰写的作品简介、剧情介绍或将最近的几章的标题等作为剧情回顾内容,读者通过阅读剧情回顾内容,快速获取前面章节的剧情。但是,以上做法依靠人为来撰写剧情回顾,效率低且人工成本高;而许多连载作者的标题往往无法概括章节内容,甚至标题仅为简单数字,仅仅依靠标题的简单罗列无法达到有效的剧情回顾功能。此外,现有做法在剧情回顾时,往往未进行筛选就将所有章节都进行内容摘要提炼,提炼过程费时费力,且内容较为臃肿,读者阅读剧情回顾时容易产生疲劳感。
发明内容
为了有助于改善现有的剧情回顾方式无法精炼的概括前文精彩内容的问题,本申请提供了一种小说剧情回顾生成方法、电子设备及存储介质。
第一方面,本申请提供一种小说剧情回顾生成方法,所述方法包括:
S10:计算章节的热度,并通过热度的高低筛选出热点章节;
S20:提取出热点章节的内容介绍;
S30:按照热点章节的先后,将对应的内容介绍进行排序,以生成剧情回顾。
通过采用上述技术方案,通过章节热度来进行筛选,并自动提取出章节内容介绍,形成剧情回顾。读者在新章节时,可以通过此来回顾以往章节内容。
第二方面,本申请提供一种电子设备,采用如下的技术方案:
一种电子设备,该电子设备包括:
至少一个处理器;
存储器;
至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行小说剧情回顾生成方法。
第三方面,本申请提供一种计算机可读存储介质,采用如下的技术方案:
一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行第一方面提供的任一种小说剧情回顾生成方法。
综上所述,本申请包括以下至少一种有益技术效果:
本技术方案实现了自动生成剧情回顾,提升了读者的阅读体验,无需人工撰写内容摘要,提高了效率,降低了人工成本。其章节通过热度高低来进行选取,章节选取科学、智能,精选出读者感兴趣、内容量大的章节进行提炼,在总结回顾剧情的同时,避免了内容过于臃肿无聊的问题。
附图说明
图1是本申请实施例提供的一种小说剧情回顾生成方法的流程示意图;
图2是本发明一种小说剧情回顾生成方法一实施例的剧情回顾入口界面示意图;
图3是本发明一种小说剧情回顾生成方法另一实施例的剧情回顾入口界面示意图;
图4是本发明一种小说剧情回顾生成方法一实施例进入剧情回顾后的界面示意图;
图5是本发明一种电子设备一实施例的模块原理示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图1-5及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种小说剧情回顾生成方法,用于电子书阅读系统中。
本实施例以电子书阅读APP为应用示例对上述方法进行具体说明。在实际实现时,上述方法也可以用于其他阅读系统,本实施例对此不作限定。
具体参照图1,一种小说剧情回顾生成方法,方法包括:
S10:计算章节的热度,并通过热度的高低筛选出高热度的热点章节;
S20:提取出热点章节的内容介绍,内容介绍包括该章节内容的梗概;
S30:按照热点章节的先后,将对应的内容介绍进行排序,以生成剧情回顾,读者阅读该剧情回顾,即可回忆起自己已经看过的剧情。
该小说剧情回顾生成方法实现了自动生成剧情回顾,提升了读者的阅读体验,无需人工撰写内容摘要,提高了效率,降低了人工成本。其章节通过热度高低来进行选取,章节选取科学、智能,精选出读者感兴趣、内容量大的章节进行提炼,在总结回顾剧情的同时,避免了内容过于臃肿无聊的问题。
在本实施例中,章节字数越多、重要角色出现次数越多、所有用户在本章节的平均阅读时间越久、所有用户在本章节互动越多、当前用户在本章节的阅读时间越久、当前用户在本章节评论点赞越多,则认为本章节的热度越高、越值得被用户回顾。
本实施例中章节剧情热度Hi的计算方法为:Hi=F(a)+F(b)+F(c);
其中,F(a)为章节剧情指数,体现本章节的剧情是否足够充实丰富;F(b)为用户行为指数,体现所有的用户在阅读该章节时的反应数据;而F(c)为本用户行为指数,其用于体现当前读者在阅读该章节的时候,是否对该章节较为感兴趣;由上可知章节的热度高低与F(a)、F(b)及F(c)的数值都正相关。
当然,F(a)、F(b)及F(c)前还可以设置调整系数,例如提高本用户行为指数的权重:Hi=F(a)+F(b)+2F(c),则高热度章节的获取将与当前用户的个人行为高度相关(其中2为经验值,由人工运营调整)。
具体地,本实施例的章节剧情指数的计算方法为:
F(a)=lg(Nlengt)+a*(Nr1)+b*(Nr2);
其中,Nlengt是章节字数,Nr1是主角文案出现的次数,Nr2是次角出现的次数,a、b均为可根据需求进行调整的调整系数。
可以理解的是,章节的字数越多,则认为其包含内容阅读;而主角、次角等重要人物在文本中出现的次数或描述越多,则认为内容与主线剧情更加强相关,而本实施例中的a数值大于b的数值。当然,公式中还可以包括更多人物出现次数的考核,以提升识别的精度;此外,还可以将根据角色人气来调整对应的调整系数,例如通过评论等得知次角的人气较高,此时可以调高b值的大小,甚至高于a的数值,其不以本实施例中描述为限制。
在本实施例的基础上,用户行为指数的计算方法为:
F(b)=c*Avg(Ntime)+(d*Nreply+f*Nlike)/T(Time);
T(Time)=e^(c*(T1–T0));
其中,Avg(Ntime)为当前章节的平均阅读时长,Nreply为当前章节评论数,Nlike为当前章节点赞数;T(Time)为时间衰减因子,T0是当前章节发布时间,T1是当前时间,c、d、f都为可根据需求进行调整的调整系数。
可以理解的是,读者阅读章节的平均时长较长,代表读者在细读此章节,该章节内容更加吸引读者的兴趣,该章节越值得被回顾;而对于该章节的评论、点赞等互动越多,代表内容引起的讨论越多,该章节越值得被回顾;当然,互动还可以包括转发、收藏等动作,相应的加入项目至公式中即可,其不以本实施例中描述为限制。
同时,我们加入了时间衰减因子,使得互动的影响权重随时间而逐步衰减,距今越久远的章节,其点赞、评论等动作对用户行为指数的数值影响越小。
在本发明实施例的基础上,进一步地,本用户行为指数的计算方法为:
F(c)=gUtime+h*Ureply+i*Ulike;
其中,Utime为本用户阅读当前章节所耗时长,Ureply为本用户对当前章节的评论数,Ulike为本用户对当前章节的点赞数,g、h及i都为可根据需求进行调整的调整系数。
需要说明的是,与用户行为指数不同的是,本用户行为指数只与于当前该用户在阅读此章节时的数据相关,其为当前用户的个性化指数,每个用户的该指数都不一样。
其中,我们认为当前用户阅读此章节用时越久、互动次数越多,则认为当前用户对此章节越有兴趣,该章节越值得被当前用户回顾。
在本发明实施例的基础上,步骤S20中使用清华大学推出的开源大语言模型ChatGLM-6B来进行热点章节的内容介绍提取工作。当然内容介绍的提取还可以用其他方式来实现,例如通过其他语言模型来进行提取工作。
参照附图2、图3及图4所示的,在本发明实施例中,在生成剧情回顾后,还包括以下的推送步骤:
检测当前页面是否为本章节最后一页;如不是最后一页,则说明用户还未读完本章节内容,此时不提供剧情回顾内容。
如是,则推送本章节之前的热点章节的剧情回顾入口供用户选择;
用户选择点击剧情入口,此时再将剧情回顾推送至当前用户。推送时,可以自动安装顺序播放剧情内容,也可以推送各个章节的入口,供用户选择查看,其方式不以本实施例中描述为限制。
在本实施例的基础上,步骤S10中,筛选出热度最高的前n个章节;n为正整数,数值大小与已阅读章节的总字数正相关。小说的总字数越多,前述内容越多,则筛选出越多的热点章节进行展示。
需要说明的是,本发明技术方案中,仅仅针对当前用户有权限阅读的章节进行剧情回顾展示,例如只针对当前用户已订阅的章节进行筛选,而不展示用户未购买的章节内容。当然,其也可以对所有章节进行筛选,其不以本实施例中描述为限制。
该实施例方案通过剧情热度计算、剧情摘要生成,实现了剧情回顾展示交互,筛选出精彩内容,供用户查看,用于回顾书籍内容。
为解决阅读至最新章节的用户无法快速回顾剧情的问题,本发明提出了一种小说高潮剧情回顾生成办法,为每个阅读用户生成个性化的高潮剧情回顾。通过用户本人和其他用户的行为、人物角色权重计算用户已阅读章节的剧情热度,排序为前N名的章节筛选为高潮章节,使用语言模型提取高潮章节摘要,根据高潮章节顺序和摘要生成剧情回顾。
具体的计算方法为:
计算每个章节剧情热度:Hi=F(a)+F(b)+F(c);
定义:
计算章节剧情指数:F(a)=lg(Nlengt)+1.0*(Nr1)+0.5*(Nr2);其中Nlengt是章节字数,Nr1是主角文案出现次数,Nr2是次角出现次数。
计算时间衰减因子:T(Time)=e^(0.06*(T1–T0));其中T0是章节发布时间,T1是当前时间。
计算用户行为指数:F(b)=0.2*Avg(Ntime)+(1.0*Nreply+1.5*Nlike)/T(Time);其中Avg(Ntime)是平均用户阅读时长,单位是分钟,计算时除去阅读时长最高的10%数据、阅读时长最低的10%数据;
Nreply是评论数;Nlike是点赞数。
计算本用户行为指数:F(c)=0.5Utime+6*Ureply+3*Ulike;其中Utime是当前用户阅读时长,Ureply当前用户评论数,Ulike当前用户点赞数。
下面我们带入具体数字到本实施例中进行计算,
假定小说为书城中的小说《*****》,此时作者更新了10章内容,我们取前10章的数据,各个章节字数数组为[3853,3610,3751,3670,3420,3173,3257,3547,3340,2898];
假定各个章节评论数组为[10,3,2,3,4,2,0,4,3,5];
假定各个章节点赞数组为[4,1,2,1,2,0,1,0,2,3];
假定各个章节所有用户平均阅读时长数组为[9,7,8,6,7,8,6,7,6,6],单位为分钟;
假定各个章节中主角名称出现次数数组为[42,42,36,51,34,30,22,57,58,21];
假定各个章节中次角名称出现的次数数组为[22,8,5,6,4,6,3,5,4,6];
假定各个章节更新时间距今数组为:[10,9,8,7,6,5,4,3,2,1],单位为天;
假定当前用户在阅读本小说时,评论了第一章、第三章,点赞了第六章的内容。
假定当前用户阅读各个章节所耗时间的数组为:[10,8,9,6,6,7,8,7,6,6];
将以上数据代入计算公式,则计算出前十章节的热度分别为:[79.99,59.30,58.88,66.24,50.25,47.43,34.66,72.49,74.17,41.47]
则筛选出的高潮章节为:第1章、第8章、第9章;
使用大语言模型ChatGLM-6B提取内容介绍,并排序,则热点章节的剧情回顾为:
第一章:少年甲夜里悄悄读着一本书,他对其中的一句话感到不满,怀念父亲。突然,地窖门被打开,甲装作睡觉。他被带到演武堂,成为其他甲家族子弟练拳的靶子。其中,乙作为替代他的新少家主出现。甲心中燃起怒火。
第八章:家族内斗的悲哀,甲被丙痛殴,身体逐渐变强。丁怀疑甲掌握特殊的护体功法。丙使用千机劫雷戟,甲躲避闪电的袭击。
第九章:炼器师邪琅凶残无比,憎恶程度令人惊讶。他抓住甲,展开逃生逃亡。甲家族陷入危机。
推送以上内容的入口至读者,供其选择观看,用于读者回顾剧情。
本申请实施例还提供一种电子设备,如图5所示,图5所示的电子设备700包括:处理器701和存储器703。其中,处理器701和存储器703相连,如通过总线702相连。可选地,电子设备700还可以包括收发器704。需要说明的是,实际应用中收发器704不限于一个,该电子设备700的结构并不构成对本申请实施例的限定。
处理器701可以是CPU(CentralProcessingUnit,中央处理器),通用处理器,DSP(DigitalSignalProcessor,数据信号处理器),ASIC(ApplicationSpecificIntegratedCircuit,专用集成电路)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器701也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等。
总线702可包括一通路,在上述组件之间传送信息。总线702可以是PCI(PeripheralComponentInterconnect,外设部件互连标准)总线或EISA(ExtendedIndustryStandardArchitecture,扩展工业标准结构)总线等。总线702可以分为地址总线、数据总线等。为便于表示,图5中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器703可以是ROM(ReadOnlyMemory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,RAM(RandomAccessMemory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是EEPROM(ElectricallyErasableProgrammableReadOnlyMemory,电可擦可编程只读存储器)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
存储器703用于存储执行本申请方案的应用程序代码,并由处理器701来控制执行。处理器701用于执行存储器703中存储的应用程序代码,以实现前述方法实施例所示的内容。
其中,电子设备包括但不限于:移动电话、笔记本电脑、PDA(个人数字助理)、PAD(平板电脑)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。还可以为服务器等。图5示出的电子设备仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
本申请实施例还提供一种计算机可读存储介质,其上存储有计算机程序,当计算机程序在计算机中执行时,令计算机执行上述实施例提供的一种小说剧情回顾生成方法。
本发明技术方案,解决了阅读至最新章节的用户无法快速回顾剧情的问题。该小说高潮剧情回顾生成办法,为每个阅读用户生成了个性化的高潮剧情回顾。通过用户本人和其他用户的行为、人物角色权重计算用户已阅读章节的剧情热度,排序为前几名的章节筛选为高潮章节,使用语言模型提取高潮章节摘要,根据高潮章节顺序和摘要生成剧情回顾。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。
以上仅是本申请的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
机译: 用于增强增强型数字图像的电气设备;一种改进的生成地址的方法,用于通过以下方式提取对一个或多个像素随机访问的存储器:输入图像数字电子设备有一个限制;从至少一个输入图像中提取出的数字发生器有一个极限;改进的地址发生器电路,用于在一个或多个像素的随机存取存储器中生成地址。完美处理数字图像的电器;用于处理DA的改进方法至少一个输入图像数字电子设备具有导出输出图像处理的数字电子设备的限制;数字图像处理电路中的随机存取存储器和会议桌中的数字图像处理电路中的随机存取存储器
机译: 1个支持电子操作的安装程序(软件分发系统)和1个支持电子操作的安装方法(软件分发方法)以及供应或分发介质,1个支持电子功能的操作软件管理装置和方法以及供应或分发介质,1个仅电子设备可操作的安装程序管理装置和方法,以及供应或分配介质,1个仅电子设备可操作的安装程序生成器以及一个1个仅电子设备可操作的安装程序生成方法以及供应或分配介质,仅第一个电子设备运行允许软件和一个仅允许电子操作的软件1个仅允许电子操作的方法和供应或分配介质,1个仅允许电子操作的软件生成装置和方法,以及提供或分配介质,1个仅允许电子操作的软件商品制造
机译: 行进路线生成系统,行进路线生成方法,行进路线生成程序,存储介质存储行进路线生成程序,运行管理系统,运行管理方法,运行管理程序,存储介质存储运行管理存储程序,存储模式生成程序,存储介质存储旅行模式生成程序和旅行模式生成方法