EMC Avamar 技术白皮书 企业数据的冗余程度极高,在同一系统内和不同系统之间存储着许多完全相同的文件或数据(例如,发送给多个接收者的操作系统文件或文档)
编辑的文件也存在与以前版本相同的大量冗余数据
传统的备份软件一次次地重复存储所有这些冗余数据,因此进一步增加了冗余
Avamar 利用获得专利的全局重复数据消除技术和单实例存储技术,消除了文件和子文件数据段级别的冗余
在源位置全局消除冗余数据 在备份操作期间,Avamar 是在源位置解决备份数据冗余问题的,然后才跨 LAN 或 WAN 传输数据
将 Avamar 备份代理部署在需要保护的系统(如服务器、台式机和笔记本电脑)上,可识别并过滤掉单个系统内和多个系统之间的文件中随时间推移而重复存储的数据段
这可确保每个具有唯一性的数据段仅在整个企业内备份一次
因此,拷贝或编辑的文件、共享的应用程序、嵌入的附件,甚至每天都在变化的数据库,都只会产生少量的增量备份数据
通过仅移动新的、具有唯一性的子文件数据段,Avamar 可将每日所需的网络带宽和存储量减少到 1/500
通过在全局范围内只存储每个子文件数据段的单个实例,Avamar 还可将总体后端磁盘存储量降低到 1/50,从而实现经济高效的基于磁盘的长期恢复
可变长度数据段与固定长度数据段 确定数据段大小的方法是在数据段(或子文件)级别消除冗余数据的关键因素
快照或复制技术通常采用固定块或固定长度数据段
遗憾的是,即便对数据集只进行很小的改动(例如,在文件开头插入数据),尽管这样做对数据集的实际改动其实是极小的,但也会改变数据集中的所有固定长度数据段
Avamar 使用智能的方法来确定数据段的大小,这种方法通过观察数据本身来确定逻辑边界点,从而消除了低效现象
确定逻辑数据段 Avamar 获得专利的确定数据段大小的方法旨在跨企业内的所有系统实现最佳效率