首页> 中文期刊>软件学报 >大规模移动应用第三方库自动检测和分类方法

大规模移动应用第三方库自动检测和分类方法

     

摘要

移动应用中,广泛使用第三方库来帮助开发和增强应用功能.很多关于移动应用分析以及访问控制的研究工作,需要在分析之前对第三方库进行检测、过滤或者对其进行功能分类.当前,大部分研究工作都以使用白名单的方式来检测第三方库或者对其功能进行分类.然而,通过白名单检测第三方库不完善且不准确,其原因包括:(1)第三方库的种类和数量很大;(2)常见的代码混淆或者第三方库伪装等技术使得白名单方法不能准确地识别第三方库.提出一种第三方库自动检测和分类方法,包括基于多级聚类技术准确识别第三方库以及基于机器学习对第三方库的功能进行准确分类.实验对超过130000个Android应用进行分析,验证所提出方法的有效性.实验总共检测到4916个不同的第三方库.在人工标记的数据集上,通过十折交叉验证,对第三方库分类的准确率达到84.28%.将训练好的分类器应用于全部4916个检测到的第三方库,人工进行抽样验证的准确率达到75%.%Third-Party libraries are widely used in mobile applications such as Android apps.Much research on app analysis or access control needs to detect or classify third-party libraries first in order to provide accurate results.Most previous studies use a whitelist to identify third-party libraries and manually categorize them.However,it is impossible to build a complete whitelist of third-party libraries and classify them because:(1) there are too many of them;and (2) common techniques such as library obfuscation and library masquerading cannot be handled with a whitelist.In this paper,an automated approach is proposed to detect and classify frequently-used third-party libraries in Android apps.A multi-level clustering based method is presented to identify third-party libraries,and a machine learning based technique is applied to classify the libraries.Experiments on more than 130000 apps show that 4916 third-party libraries can be detected without prior knowledge.The classification result of 10-folds cross validation on sampled libraries is 84.28%.With the trained classifier,the proposed approach is able to classify more than 75% of the 4916 libraries into six categories with an accuracy of 75%.

著录项

  • 来源
    《软件学报》|2017年第6期|1373-1388|共16页
  • 作者单位

    智能通信软件与多媒体北京市重点实验室(北京邮电大学计算机学院),北京 100876;

    高可信软件技术教育部重点实验室(北京大学),北京 100871;

    北京大学信息科学技术学院软件研究所,北京 100871;

    高可信软件技术教育部重点实验室(北京大学),北京 100871;

    北京大学信息科学技术学院软件研究所,北京 100871;

    高可信软件技术教育部重点实验室(北京大学),北京 100871;

    北京大学信息科学技术学院软件研究所,北京 100871;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    Android; 第三方库; 广告库; 移动应用; 机器学习;

  • 入库时间 2022-08-18 05:33:33

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号