第二课 地质数据及其统计分析 讲5个方面的问题 一、地质数据的概念、类型及属性 二、地质数据的选择和整理 三、地质数据的预处理 四、地质数据的统计分布特征 五、与油气地质有关的分布函数 一、地质数据的概念、类型及属性 1 概念 地质信息的数、字母和符号的集合。 2 类型 按地质数据的特点分为观测、综合和经验数据三大类。 ◆观测数据——对研究对象直接进行观测和度量所获得的数据。 又分为定性和定量数据。 ①定性数据——用代码或字符等来表示某一地质特征及其相互间关系的一种“数据”。 又分为名义型和有序型两种。 名义型数据 通过鉴别区分不同的对象或个体并赋予不同代码后形成的数据。如:岩石的颜色、结构、构造等。 有序型数据 有次序的数码或代码并用次序来表示数码或代码间的一种单调升降关系的数据。如:生油岩的干酪根分成 I,II,III 级。又如:油气储量的级别等。 ②定量数据——具有数量概念的数据。分为间隔型和比例型数据。 间隔型数据 特点:不仅能比较其大小,而且能定量地表示数据间的差异;无自然零值,但有负值。 比例型数据 特点:具有绝对零值而没有负值的间隔型数据。大多数定量数据都属比例型数据。 ◆综合数据——由观测数据经有限次算术或代数运算后,并具有明确地质意义的数据。 如:甲烷系数、时间—温度指数值、平均值、均方差、相关系数等。 ◆经验数据——根据大量实际观测值归纳出来或根据公式计算而得出的经验值。 如:单储系数、排烃系数等。 3 属性 (1 ) 统计规律性 随机变量的性质,一次观测具有偶然性,多次重复观测,则具有规律性。 (2 ) 函数规律性 当自变量给定,函数 就完全确定了,如:原子核发生衰变时,即子元素数量公式为:0tn e 式中:0n ——衰变开始时原子核的总数 t ——衰变时间 ——时间t 后母元素的数量 ——系数 二、地质数据的选择和整理 1 地质数据选择时应注意的问题 ◆根据研究目的和要求选择数据 ◆选择的数据反映指标的地质意义明确 ◆数据的水平要一致,可靠性要强 ◆能对数据的统计和函数规律性作出描述、 ◆数量应能满足数学模型的要求 ◆数据的分布均匀、合理 2 数据的处理 (1 ) 原始数据矩阵,即 1 11 212 12 2212ppijnnnpnpxxxxxxXxxxx...