实验29 DNA 序列分类 实验目的 学习利用MATLAB 提取DNA 序列特征建立向量的方法,掌握利用FCM 命令进行DNA分类的方法,学会做出分类图形直接给出分类结果的MATLAB 编程。 知识扩展 DNA 序列分类 DNA(Deoxyribonucleic acid),中文译名为脱氧核苷酸,是染色体的主要化学成分,同时也是基因组成的,有时被称为“遗传微粒”。DNA 是一种分子,可组成遗传指令,以引导生物发育与生命机能运作。主要功能是长期性的资讯储存,可比喻为“蓝图”或“食谱”。DNA 分子是由两条核苷酸链以互补配对原则所构成的双螺旋结构的分子化合物。其中两条 DNA 链中对应的碱基A-T 以双键形式连接,C-G 以三键形式连接,糖-磷酸-糖 形成的主链在螺旋外侧,配对碱基在螺旋内侧。 FCM 算法中样本点隶属于某一类的程度是用隶属度来反映的,不同的样本点以不同的隶属度属于每一类;但是算法中的概率约束∑uij=1 使 得 样本的典 型 性反映不 出 来 , 不 适 用 于 有 噪 音 , 样 本 分 布 不 均 衡 , 存 在 两 个 或 者 两 个 以 上 样 本 分 别 距两 个 类 的 距 离 相 等 的 样 本 等 等 。 欧 氏 距 离 ( Euclidean distance) 也 称 欧 几 里 得 距 离 , 它 是 一 个 通 常 采 用 的 距离 定 义 , 它 是 在 m 维 空 间 中 两 个 点 之 间 的 真 实 距 离 。 公 式 在 二 维 和 三 维 空 间 中 的 欧 式 距 离 的 就 是 两 点 之 间 的 距 离 , 二 维 的 公 式 是 d = sqrt((x1-x2)^+(y1-y2)^) 三 维 的 公 式 是 d=sqrt(x1-x2)^+(y1-y2)^+(z1-z2)^) 推 广 到 n 维 空 间 , 欧 式 距 离 的 公 式 是 d=sqrt( ∑ (xi1-xi2)^ ) 这 里 i=1,2..n xi1 表 示 第 一 个 点 的 第 i 维 坐 标 ,xi2 表 示 第 二 个 点 的 第 i 维 坐 标 n 维 欧 氏 空 间 是 一 个 点 集 ,它 的 每 个 点 可 以 表 示 为 (x(1),x(2),...x(n)),其中x(i)(i=1,2...n) 是实数 , 称 为x的第i 个坐 标, 两个点x和y=(y(1),y(2)...y(n))之 间 的 距 离 d(x,y)定 义 为 上 面 的 公 式 . 欧 氏 距 离 判 别 准 则 如 下 : 若 dAdB,则 将 Xi 点 判 为 B 类 若...