第七章 有序地质量最优分割法第一节 概 述 地层划分与对比是煤田地质勘探的主要任务之一。在地质工作中,通常是寻找地层的不整合或假整合界线,或者利用古生物化石、岩石矿物等地质特征对地层进行划分与对比。这种划分方法比较直观,适用于较大地层单元的划分与对比。当地质特征间的差异性不显著时,运用上述直观、定性的方法来解决较小地层单元的进一步划分就有一定的困难因此,近年来开始利用有序地质量,即运用数学方法,并借于电子计算机定量地划分地层提出了“有序地质量最优分割法”。 地质数据中有相当多是有序的。这些按一定顺序排列的地质变量,叫做有序地质量。例如,沿地层露头剖面采集的岩石标本;钻孔取出的岩芯样品;与这些岩石、样品有关的岩性、物理化学和古生物数据;以及地球物理测井数据等。它们都是有序地质量。这类数据的特点是样品的前后次序不能变更。所以,一些不考虑样品排列顺序的数学处理方法,对此不适用。有序地质量最优分割法,就是对一批有序数据(地质体)进行分段的统计方法。 设有n 个按顺序排列的样品,每个样品测得 p 个变量,这批数据可用数据矩阵的形式表示为X=[xil]=(x11x12⋯x1 px21x22⋯x2 p⋮⋮⋮⋮xn1xn2⋯xnp)nxp其中,xil表示第i 个样品第l 个变量的取值。 若对以上n 个有序样品进行分割(分段),可能有 cn−11+cn−22+⋯+cn−1n−1=2n−1−1种划分方法,每一种分法称为一种分割。在所有这些分割中,存在这样一种分割,它使得各段(组)内部样品之间的差异性最小(即样品数据的组内离差平方和最小),而使段(组)之间的差异性最大(即样品数据的组间离差平方和最大)。这种对n 个样品分段并使组内离差平方和最小的分割方法,称为最优分割法。 样品变量总离差平方和的分解式为 T=W +B (7—1)式中,T 为总离差平方和;W 为组内离差平方和;B 为组间离差平方和。由式(7—1)可知,假如n 个样品分为K 段,每段的样品个数为nk ,若每个样品只取一个变量,则 W =∑k=1K∑i=1nk( xik−xk)2 (7—2) B=∑k =1K∑i=1nk( xk−x)2=∑k=1Knk( xk−x)2 (7—3)因此,寻求最优分割,就是用计算的分法找出使组内离差平方和(W )最小的那些分割点。这与判别分析中费歇准则相似,所以有序地质量最优分割法,有人又称为“F-分割法”或“有序样品的聚类分析”。第二节 单元有序数据的最优分割若有n 个有序样品,每个样品只取一个变量,则有n 个有序数据序列,为 X={x1...