下载后可任意编辑信息服务的数据预取方法综述 摘要:基于 lDD 的预取策略如 DDp 考虑了数据距离,但是没有考虑数据的访问概率和更新频率和数据大小,针对以上问题提出基于价值的数据预取(cDp)策略,一些重要的数据预取因素如访问概率、更新频率、数据项大小、数据距离和有效范围等都包含在价值函数里,根据价值函数值的大小来选择被预取的数据。通过实验对比,cDp 比 DDp 策略更有效的提高缓存的命中率。 关键词:位置相关信息服务;位置相关数据;数据预取;缓存命中率 0 引言 移动计算环境下,网络的弱连接、低带宽使得用户而无法及时猎取所需的信息,特别是查询位置相关数据(locationDependentData,lDD)时,容易因用户位置的改变而导致查询结果过时失效或者不正确。而数据预取技术能够显著提高数据访问速度和充分利用广播带宽[1]。 1 基于价值的数据预取策略 1.1 位置相关数据的模型位置相关数据(lDD),是指其值取决于具体地理位置的数据,lDD 具有特定的适用范围。 数据的有效范围区域(ValidscopeArea),是指数据实例有效范围的几何区域。每个 lDD 实例有一个特定的有效范围,只有在此有效范围之内,该实例才是正确的。 数据距离(DataDistance),是指 mc 当前位置和数据实例有效范围之间的距离。 1.2cDp 预取方法本文提出 cDp 策略,预取时根据价值函数的值进行选择,预取价值函数如下:cost=puseful×(benefit-penalty)(1) 式(1)中 puseful 为 mc 访问 lDD 的概率,benefit 为 mc 预取 lDD 的获益价值,penalty 为预取 lDD 的惩处代价。 1.2.1 数据预取的奖惩代价数据预取到本地缓存后,并非所有的数据都是mc 需要的,经过运算处理后能成为有效查询的数据才是用户需要的,只有这部分数据才能给 mc 的查询访问带来获益。本文用 fbenefit(di)表示预取数据1下载后可任意编辑di 的获益价值函数,即 mc 未预取数据时的访问时间与预取数据时的访问时间减少的比例。 xxxxc 访问某一种 lDD 可能性的概率,主要以 mc 经过该数据有效范围的概率和未来访问该数据的概率为依据,因此把 mc 将来可能经过有效范围内数据列为预取的候选集 c。主要考虑以下两点因素:①从时间的角度来考虑。越久未被更新的数据,说明其因服务器端的数据更新而导致预取数据失效的可能性越小;而越久未被访问的数据说明其比较陈旧,再次被访问的可能性就越小。②从空间的角度来考虑。讨论表明,在...