首页> 中国专利> 一种基于PLSA主题模型和EM算法确定网页元素主题的方法

一种基于PLSA主题模型和EM算法确定网页元素主题的方法

摘要

本发明公开了一种基于PLSA主题模型和EM算法确定网页元素主题的方法,该方法包括:(1)选取待测网页的网页元素对应的主题,找出主题关键词集合和主题集合;(2)对待测网页的网页元素进行预处理;(3)根据获取到的所述主题集合,按照PLSA模型公式训练出主题‑词矩阵以及网页元素‑主题矩阵,(4)采用改进的EM算法求解出网页元素中对应概率最大的主题,作为该网页元素的主题;(5)当网页结构或元素属性改变而造成网页状态变化后,重新获取当前DOM,重新对当前网页内的网页元素的主题进行判定,并生成网页元素XPath定位器。本发明根据改进EM算法判定出网页元素的主题,自动生成对应的XPath绝对路径,提高了网页元素定位器在自动化测试中的鲁棒性。

著录项

  • 公开/公告号CN111459806B

    专利类型发明专利

  • 公开/公告日2022.09.23

    原文格式PDF

  • 申请/专利权人 南京邮电大学;

    申请/专利号CN202010185732.8

  • 发明设计人 杨龙祥;贾秀秀;刘玉珍;

    申请日2020.03.17

  • 分类号G06F11/36;G06F16/958;

  • 代理机构南京苏高专利商标事务所(普通合伙);

  • 代理人王恒静

  • 地址 210003 江苏省南京市鼓楼区新模范马路66号

  • 入库时间 2022-09-26 23:22:45

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号