支持向量回归用于氨基酸描述符在肽QSAR建模中的性能评价(黑体三号、居中)应用化学2008级学号2008123张明康(宋体小四号、居中)任课教师印家健副教授(宋体小四号、居中)摘要:(宋体小四号、加粗、顶格)采用支持向量回归方法用3个数据集来评价z-scales、c-scales、ISA-ECI、MS-WHIM、PRIN等5个氨基酸描述符在肽QSAR支持向量回归模型构建中的性能并对核函数进行选择,采用留一法交叉检验的结果显示径向基核函数要好于多项式核函数和线性核函数;在以径向基核函数的支持向量回归模型中表明z-scales的预测准确度要略优于其它描述符,且在同一描述符的情况下SVR的预测效果要好于其它线性方法,说明SVR在肽QSAR模型构建中是一个可行的方法
(中文用楷体小四号、英文用TimesNewRoman小四号、两端对齐)关键词:(宋体小四号、加粗、顶格)肽,定量构效关系,核函数,支持向量回归,性能评价(楷体小四号、两端对齐)(关键词间,用逗号隔开)多肽具有高活性、高选择性及副作用小的特点,是维持生命过程中必不可少的物质,目前已成为药物研究的热点之一
在多肽类似物的研究和开发中,定量构效关系(Quantitativestructure-activityrelationships,QSAR)是一个重要的理论计算方法和常用手段
所谓多肽QSAR,就是用数学模式来表达多肽类似物的化学结构信息与特定的生物活性强度间的相互关系[1,2]
多肽的化学结构描述符普遍采用氨基酸的结构描述参数去定量描述多肽的化学结构和性质,其基本思路是以多肽的最基本的结构信息——氨基酸序列为基础,对一系列多肽类似物中变化的氨基酸残基进行定量描述,并把氨基酸序列转换成结构描述符矩阵的一个向量[1,2]
目前在肽QSAR模型中常用的氨基酸描述符主要有:基于实验的z-scales[1]、基于理论计算的t-s