首页> 中国专利> 一种基于统计计算的网站搜索引擎优化方法及系统

一种基于统计计算的网站搜索引擎优化方法及系统

摘要

本发明公开了一种基于统计计算的网站搜索引擎优化方法及系统,用于网页搜索技术领域,所述方法包括的步骤依次为:统计网站流量和来量词,计算出网站页面的标题和描述信息;将计算出的标题应用到url的链接文本上,在进行搜索时,网页程序会调用系统自动提供的新的url,使用户快速搜索到需求的网页。所述系统包括与所述方法步骤相对应的自动计算单元和链接单元。这样只要在网站上线时,设置好规则,系统将能自动根据网页的来量词或者探索的到的关键词进行标题和简介信息的计算和生成,由于整个过程全自动运行,无需人工干预,响应速度块,节省时间。

著录项

  • 公开/公告号CN105930442A

    专利类型发明专利

  • 公开/公告日2016-09-07

    原文格式PDF

  • 申请/专利权人 广州天趣网络科技有限公司;

    申请/专利号CN201610246899.4

  • 发明设计人 夏乐勇;

    申请日2016-04-19

  • 分类号

  • 代理机构北京隆源天恒知识产权代理事务所(普通合伙);

  • 代理人闫冬

  • 地址 510630 广东省广州市天河区龙口东路129号1203单元

  • 入库时间 2023-06-19 00:28:54

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-18

    授权

    授权

  • 2016-10-05

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20160419

    实质审查的生效

  • 2016-09-07

    公开

    公开

说明书

技术领域

本发明涉及网页搜索技术领域,具体为一种基于统计计算的网站搜索引擎优化方法及系统。

背景技术

随着互联网及相关技术的快速发展,人们的生活与互联网的联系也越来越紧密。目前,在工作、学习及生活过程中,人们都会有意识的去百度一下来搜索自己想到的答案,在这种趋势下,被需求的网站如何快速的被用户搜索到以及企业如何让自己的网站被推荐给客户,成为一个重要的课题。SEO(搜索引擎优化)是目前网站推广的重要方法,通过SEO的使用提高了用户锁定需求网站的速度,也为企业推荐自己的网站给客户提供了一条重要的途径。

但是,传统SEO需要针对网站访问统计进行大量的分析,提取有用的关键词,针对url进行标题和简介的设置,有时候还需要针对优秀的url进行友情链接的推广,推广效果和SEO响应的速度密切相关。比如针对一个热点事件,只有短短几天时间的新鲜期,如何能在第一时间将相关内容排到搜索引擎前列,这就是关系到成千上万的流量的问题,要在第一时间发现优秀关键词,第一时间将优秀关键词修改体现到标题或者简介中去,并且第一时间将优秀的url做好站内的链接是一个工作非常繁琐,也很枯燥的工作,这个工作不仅涉及的数据量 大,也非常的繁琐,并且整个过程基本上由人工完成,操作繁琐且会出现遗漏。

鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本发明。

发明内容

为解决上述技术缺陷,本发明采用的技术方案在于,提供一种基于统计计算的网站搜索引擎优化方法,包括:

S1:统计网站流量和来量词,计算出网站页面的标题和描述信息;

S2:将计算出的标题应用到url的链接文本上,在进行搜索时,网页程序会调用系统自动提供的新的url,使用户快速搜索到需求的网页。

较佳的,所述步骤S1包括:

S11:利用捕获程序获得网址url在指定时间的访问记录和搜索引擎参考记录;

S12:将统计的url信息和搜索引擎参考记录存入写队列;

S13:利用克隆程序将写队列中的数据存入第一数据库;并按照日期、关键词和url分别访问第一数据库,获得每日、每个url、每个关键词的数量,并存入第二数据库;

S14:用户搜索网页时,系统会根据所述第二数据库中的数据计算所需页面的标题和简介信息,页面程序会调用计算后生成的标题和简介信息并显示在页面上。

较佳的,所述捕获程序利用javascript(瓜哇脚本语言)所编制程序的捕获能力能现。

较佳的,所述克隆程序利用php(英文超级文本预处理语言)所编程序的克隆特性实现。

较佳的,所述步骤S14包括:

S140:检查更新频率,达到更新频率执行步骤S142,若未达到更新频率,则执行步骤S141;

S141:提供上一次搜索网页页面所使用的标题和简介信息;

S142:确定算法是否锁定,若锁定则执行步骤S143,,若未锁定则执行步骤S144;

S143:提供上一次搜索网页页面所使用的标题和简介信息;

S144:调整权重,确定不同搜索引擎的权重;

S145:进行词语排序,根据计算好的搜索引擎权重,计算不同搜索所使用关键词的权重,并从大到小排列,生成一个关键词列表;

S146:进行种子词定制,根据种子词抓取更多相关联的词语,扩充词数量;

S147:进行词语校验,确定必须出现的词和必须屏蔽的词;

S148:设置推荐词,以满足特殊运营需求的需要;

S149:判断词数量,若词数量不足,则执行步骤S1410;若词数量足够,则执行步骤S1411;

S1410:执行候补规则程序,当系统读取到词数量不足的信息时,系统会自动调用在人工规则设置阶段所设置的候补词语进行词数量 的候补,补充后执行步骤S1411;

S1411:进行长度校验,删除超长的部分,校验的主要是标题和简介的长度;

S1412:输出json(javascript对象符号)格式的结果,包含页面的标题和简介信息。

较佳的,所述步骤S2包括:

S21:定时更新链接文字,每天定时检查链接内的url的标题,将标题中的最重要的关键词(第一个)修改为url的链接文字;

S22:当网页程序调用链接接口的时候,系统将提供最新的json格式的url和链接文字列表,供调用方使用。

一种基于统计计算的网站搜索引擎优化的系统,包括:

自动计算单元,用于统计网站流量和来量词,计算出网站页面的标题和描述信息;

链接单元,用于将计算出的标题应用到url的链接文本上,在进行搜索时,网页程序会调用系统自动提供的新的url,使用户快速搜索到需求的网页。

较佳的,所述自动计算单元包括:

数据统计子单元,其利用捕获程序获得网址url在指定时间的访问记录和搜索引擎参考记录;

写队列子单元,用于将统计的url信息和搜索引擎参考记录存入写队列;

数据库存储子单元,其利用克隆程序将写队列中的数据存入第一 数据库;并按照日期、关键词和url分别访问第一数据库,获得每日、每个url、每个关键词的数量,并存入第二数据库;

自动计算子单元,用户搜索网页时,系统会根据所述第二数据库中的数据计算所需页面的标题和简介信息,页面程序会调用计算后生成的标题和简介信息并显示在页面上。

较佳的,所述自动计算子单元包括:

频率检查模块,用于检查更新频率,达到更新频率导入算法锁定检测模块,若未达到更新频率,则导入第一信息储存模块;

第一信息储存模块,用于提供上一次搜索网页页面所使用的标题和简介信息;

算法锁定检测模块,用于确定算法是否锁定,若锁定则导入第二信息储存模块,若未锁定则导入权重调整模块;

第二信息储存模块,用于提供上一次搜索网页页面所使用的标题和简介信息;

权重调整模块,用于调整权重,确定不同搜索引擎的权重;

词语排序模块,用于进行词语排序,根据计算好的搜索引擎权重,计算不同搜索所使用关键词的权重,并从大到小排列,生成一个关键词列表;

种子词定制模块,用于进行种子词定制,根据种子词抓取更多相关联的词语,扩充词数量;

词语校验模块,用于进行词语校验,确定必须出现的词和必须屏蔽的词;

推荐词设置模块,用于设置推荐词,以满足特殊运营需求的需要;

词数量判断模块,用于判断词数量,若词数量不足,则导入词语候补模块;若词数量足够,则导入长度校验模块;

词语候补模块,用于执行候补规则程序,当系统读取到词数量不足的信息时,系统会自动调用在人工规则设置阶段所设置的候补词语进行词数量的候补,补充后导入长度校验模块;

长度校验模块,用于进行长度校验,删除超长的部分,校验的主要是标题和简介的长度;

标题生成模块,用于输出json(javascript对象符号)格式的结果,包含页面的标题和简介信息。

较佳的,所述链接单元包括:

自动更新子单元,用于定时更新链接文字,每天定时检查链接内的url的标题,将标题中的最重要的关键词(第一个)修改为url的链接文字;

自动供应子单元,当网页程序调用链接接口的时候,系统将提供最新的json格式的url和链接文字列表,供调用方使用。

与现有技术相比,本发明的有益效果是:只要在网站上线时,设置好规则,系统将能自动根据网页的来量词或者探索的到的关键词进行标题和简介的计算和生成,由于整个过程全自动运行,无需人工干预,响应速度块,节省时间。

附图说明

图1为本发明基于统计计算的网站搜索引擎优化方法的流程图。

图2为本发明自动计算的流程图。

图3为本发明链接及调用的流程图。

具体实施方式

以下结合附图,对本发明上述的和另外的技术特征和优点作更详细的说明。

本发明提供的一种基于统计计算的网站搜索引擎优化方法,包括如下步骤:

S1:统计网站流量和来量词,计算出网站页面的标题和描述信息。

进行统计时,主要利用捕获程序获得统计数,并将所有关于访问的页面的url和来路、关键词等数据存入数据库,程序会将各种url和来路信息的数据进行简单的累加,以方便运算。在页面显示的时候,页面程序将直接调用最新的标题和简介,程序根据人工设置,抓取url指定时间的访问记录和搜索引擎来量关键词记录,按照来量排序,即可计算出标题和简介信息,这个过程由程序自动实现,各个搜索引擎所占权重可以根据实际需要人工进行调整。

S2:将计算出的标题应用到url的链接文本上,在进行搜索时,网页程序会调用系统自动提供的新的url,使用户快速搜索到需求的网页。

实施例一:

请参见图1所示,图1为本发明基于统计计算的网站搜索引擎优化方法的流程图,也为步骤S1的流程图,所述步骤S1包括:

S11:利用捕获程序获得网址url在指定时间的访问记录和搜索引擎参考记录。

在这里我们主要利用嵌装在网站中的javascript(瓜哇脚本语言)所编制程序的捕获能力捕获网址url在指定时间的访问记录和搜索引擎参考记录,并进行统计,搜索引擎参考记录中包括用户通过该引擎进入所需网页所使用的关键词。通过统计搜索引擎参考记录,我们可以确定用户是通过哪个搜索引擎、哪些关键词来到需要搜索的页面的。

S12:将统计的url信息和搜索引擎参考记录存入写队列。

S13:利用克隆程序将写队列中的数据存入第一数据库;并按照日期、关键词和url分别访问第一数据库,获得每日、每个url、每个关键词的数量,并存入第二数据库。

这里的克隆程序主要利用php(英文超级文本预处理语言)所编程序的克隆特性将写队列中数据克隆到第一数据库。

S14:用户搜索网页时,系统会根据所述第二数据库中的数据计算所需页面的标题和简介信息,页面程序会调用计算后生成的标题和简介信息并显示在页面上。

在计算前,需要人工设置规则,规则设置完成后,系统会根据规则及算法进行自动计算,生成新的标题和简介信息。

实施例二:

请参见图2所示,图2为本发明自动计算的流程图,也为所述步骤S14的流程图,所述步骤S14包括:

S140:检查更新频率,达到更新频率执行步骤S142,若未达到更新频率,则执行步骤S141。

标题和简介可以人工设置更新频率,比如3天更新一次。

S141:提供上一次搜索网页页面所使用的标题和简介信息。

S142:确定算法是否锁定,若锁定则执行步骤S143,,若未锁定则执行步骤S144。

S143:提供上一次搜索网页页面所使用的标题和简介信息。

考虑到标题和简介需要进行更新,但是当url降低到一定程度的时候,算法锁定,系统会停止关键词推荐的算法程序,锁定目前的url,以巩固网站排名,此时显示上一次的标题和简介信息。

S144:调整权重,确定不同搜索引擎的权重。

针对搜索引擎的重要程度,以及各个词语的竞争程度,确定搜索引擎及词语的权重。可以人工设置不同搜索引擎来量所占的比重,也可以在程序中添加权重的计算公式,程序会根据所设置的公式计算权重,根据搜索引擎的权重可以计算出通过该搜索引擎进入搜索页面所使用的关键词的权重。

S145:进行词语排序,根据计算好的搜索引擎权重,计算不同搜索所使用关键词的权重,并从大到小排列,生成一个关键词列表。

S146:进行种子词定制,根据种子词抓取更多相关联的词语,扩 充词数量。

在算法计算过程中为防止一个url流量较低造成的计算结果的不准确,算法会通过人工设定的种子词去搜索引擎中抓取更多的相关词,为最终标题或简介信息的生成提供更优的数量基础。

S147:进行词语校验,确定必须出现的词和必须屏蔽的词。

根据实际需求,需要人工设置屏蔽的词语和必须存在的词语,算法计算过程中,对这些词语进行校验,确定最终满足要求的词语。

S148:设置推荐词,以满足特殊运营需求的需要。

对于一些有特殊运营需求的词语,可以在人工设置规则时设置成推荐词,该词将在最终结果中肯定出现,将该词语放入关键词列表,比如有的页面是介绍的是“公交车12号线路”,就可以设置,必须要出现“公交”不能出现只有“12号”这种类型的词语,但是可能当时在12号线上发生了一些社会新闻,我们就可以再加上屏蔽词以屏蔽这些不相关的内容,在步骤S147中屏蔽掉该部分词语。

S149:判断词数量,若词数量不足,则执行步骤S1410;若词数量足够,则执行步骤S1411。

系统会根据生成标题和简介信息自动判断词的数量是否足够。

S1410:执行候补规则程序,当系统读取到词数量不足的信息时,系统会自动调用在人工规则设置阶段所设置的候补词语进行词数量的候补,补充后执行步骤S1411。

由于候补规则可能会匹配一批url,所以通用规则可能会包含一定的变量,比如{1}商品介绍,{1}就是参数,这里使用调用方提供的 参数对通用规则里的参数进行替换。

S1411:进行长度校验,删除超长的部分,校验的主要是标题和简介的长度。

S1412:输出json(javascript对象符号)格式的结果,包含页面的标题和简介信息。

Json在此处体现为字符串格式,利用javascript语言可以很好的解释其含义。

实施例三:

请参见图3所示,图3为本发明链接及调用的流程图,所述步骤S2包括:

S21:定时更新链接文字,每天定时检查链接内的url的标题,将标题中的最重要的关键词(第一个)修改为url的链接文字。

链接内的url为所述步骤S14的结果。

S22:当网页程序调用链接接口的时候,系统将提供最新的json格式的url和链接文字列表,供调用方使用。

实施例四:

一种基于统计计算的网站搜索引擎优化的系统,用于实现基于统计计算的网站搜索引擎优化方法,包括:

自动计算单元,用于统计网站流量和来量词,计算出网站页面的标题和描述信息。

链接单元,用于将计算出的标题应用到url的链接文本上,在进行搜索时,网页程序会调用系统自动提供的新的url,使用户快速搜索到需求的网页。

本实施例中通过两个单元完成对网站的快速搜索,通过对url和关键词的获取来锁定网站,避免了对网站访问统计所进行的大量分析。

实施例五:

所述自动计算单元包括:

数据统计子单元,其利用捕获程序获得网址url在指定时间的访问记录和搜索引擎参考记录。

写队列子单元,用于将统计的url信息和搜索引擎参考记录存入写队列。

数据库存储子单元,其利用克隆程序将写队列中的数据存入第一数据库;并按照日期、关键词和url分别访问第一数据库,获得每日、每个url、每个关键词的数量,并存入第二数据库。

自动计算子单元,用户搜索网页时,系统会根据所述第二数据库中的数据计算所需页面的标题和简介信息,页面程序会调用计算后生成的标题和简介信息并显示在页面上。

本实施例中,所述自动计算单元统计关键词及url并储存到数据库,根据数据库中的信息自动计算获取标题等信息,避免了大量的分析造成的时间浪费,同时也确保了低流量网站的排名。

实施例六:

所述自动计算子单元包括:

频率检查模块,用于检查更新频率,达到更新频率导入算法锁定检测模块,若未达到更新频率,则导入第一信息储存模块。

第一信息储存模块,用于提供上一次搜索网页页面所使用的标题和简介信息。

算法锁定检测模块,用于确定算法是否锁定,若锁定则导入第二信息储存模块,若未锁定则导入权重调整模块。

第二信息储存模块,用于提供上一次搜索网页页面所使用的标题和简介信息。

权重调整模块,用于调整权重,确定不同搜索引擎的权重。

词语排序模块,用于进行词语排序,根据计算好的搜索引擎权重,计算不同搜索所使用关键词的权重,并从大到小排列,生成一个关键词列表。

种子词定制模块,用于进行种子词定制,根据种子词抓取更多相关联的词语,扩充词数量。

词语校验模块,用于进行词语校验,确定必须出现的词和必须屏蔽的词。

推荐词设置模块,用于设置推荐词,以满足特殊运营需求的需要。

词数量判断模块,用于判断词数量,若词数量不足,则导入词语候补模块;若词数量足够,则导入长度校验模块。

词语候补模块,用于执行候补规则程序,当系统读取到词数量不足的信息时,系统会自动调用在人工规则设置阶段所设置的候补词语进行词数量的候补,补充后导入长度检验模块。

长度校验模块,用于进行长度校验,删除超长的部分,校验的主要是标题和简介的长度。

标题生成模块,用于输出json(javascript对象符号)格式的结果,包含页面的标题和简介信息。

本实施例中,所述统计计算子单元通过权重设置、词的补充和设置来实现关键词的确定,进而确定页面的标题和简介,算法简单且准确。

实施例七:

所述链接单元包括:

自动更新子单元,用于定时更新链接文字,每天定时检查链接内的url的标题,将标题中的最重要的关键词(第一个)修改为url的链接文字。

自动供应子单元,当网页程序调用链接接口的时候,系统将提供最新的json格式的url和链接文字列表,供调用方使用。

本实施例中通过链接单元将计算出的最新的标题和简介直接提供给调用方使用,相应速度快,避免了用户的长时间等待,对网站排名起到至关重要的作用。

尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号