基于软件执行路径的行为模式挖掘算法讨论随着全球智能化的不断进展,计算机软件在人们生活中发挥越来越重要的作用,各行各业的软件产品应运而生,由此也产生大量冗余的软件数据。将数据挖掘中的方法应用到软件的行为分析中,从这些软件数据中猎取有价值的信息,能够帮助软件开发人员进行系统错误定位、软件漏洞预测、系统行为预测等工作,从而有效地完成对软件的更新和维护工作。本文从猎取软件的动态行为模式出发,在软件执行路径中进行序列模式挖掘,将具有高效用的模式提供给讨论人员,本文主要工作如下。首先,本文对软件执行路径的特性进行分析。通过对软件执行路径的理论讨论,提出本文的讨论工作是在软件动态行为分析基础上进行的,阐述猎取软件执行路径的方法,分析序列模式的特性,同时总结经典的序列模式挖掘算法的实现思想和优缺点。其次,针对行为模式结果集的数量较多的问题,提出基于软件执行路径的高效用闭模式挖掘算法。为软件执行路径中的每个函数模式设计一种结构,保存函数所在的序列编号和效用值等信息,根据这种结构提出一种剪枝策略,能够有效地减少扩展次数,同时根据这种结构提出挖掘闭模式的方法,从而实现压缩结果集数量的目的。再次,针对用户难以确定效用阈值的问题,提出挖掘 Top-k 高效用连续序列模式的算法。为软件执行路径中的每个函数模式设计一种结构,其中包含下一个相邻的函数信息,以便挖掘连续序列模式。同时,为尽快丢弃位于 k 个位置之后的模式,提出四种剪枝策略,从不同方面提高算法的执行效率。最后,选取不同的数据集,在 Windows 环境下进行实验,比较本文提出的算法与其他同类型算法的执行效果,从运行时间、内存使用量和剪枝策略效率等角度进行评估。