基数(radix)树 - 嵌入式系统书撰写 2010-07-23 基数(radix)树 Linux基数树(radix tree)是将指针与long整数键值相关联的机制,它存储有效率,并且可快速查询,用于指针与整数值的映射(如:IDR机制)、内存管理等。 IDR(ID Radix)机制是将对象的身份鉴别号整数值ID与对象指针建立关联表,完成从 ID与指针之间的相互转换。IDR机制使用radix树状结构作为由 id进行索引获取指针的稀疏数组,通过使用位图可以快速分配新的ID,IDR机制避免了使用固定尺寸的数组存放指针。IDR机制的API函数在 lib/idr.c中实现,这里不加分析。 Linux radix树最广泛的用途是用于内存管理,结构 address_space通过 radix树跟踪绑定到地址映射上的核心页,该 radix树允许内存管理代码快速查找标识为 dirty或 writeback的页。Linux radix树的API函数在 lib/radix-tree.c中实现。 (1)radix树概述 radix树是通用的字典类型数据结构,radix树又称为 PAT位树(Patricia Trie or crit bit tree)。Linux内核使用了数据类型 unsigned long的固定长度输入的版本。每级代表了输入空间固定位数。 radix tree是一种多叉搜索树,树的叶子结点是实际的数据条目。每个结点有一个固定的、2^n指针指向子结点(每个指针称为槽 slot),并有一个指针指向父结点。 Linux内核利用radix树在文件内偏移快速定位文件缓存页,图 4是一个 radix树样例,该 radix树的分叉为 4(22),树高为 4,树的每个叶子结点用来快速定位 8位文件内偏移,可以定位 4x4x4x4=256页,如:图中虚线对应的两个叶子结点的路径组成值0x00000010和 0x11111010,指向文件内相应偏移所对应的缓存页。 图4 一个四叉radix树 Linux radix树每个结点有64个slot,与数据类型long的位数相同,图1显示了一个有3级结点的radix树,每个数据条目(item)可用3个6位的键值(key)进行索引,键值从左到右分别代表第1~3层结点位置。没有孩子的结点在图中不出现。因此,radix树为稀疏树提供了有效的存储,代替固定尺寸数组提供了键值到指针的快速查找。 图1 一个3级结点的radix树及其键值表示 (2)radix树slot数 Linux内核根用户配置将树的slot数定义为 4或 6,即每个结点有16或 64个slot,如图2所示,当树高为 1时,64个slot对应 64个页,当树高为 2时,对应 64*64个页。 图2 高为1和2、slot数为64的 radix树 Linux内核 radix树的 slot数定义如下(在 lib/radix-t...