IPI-InternationalProteinIndex数据库介绍俞鸿yuhong@biosino
cnyuhong@scbit
orgIPI-InternationalProteinIndex•EMBL-EBI•URL:http://www
uk/IPI/IPIhelp
html•IPIprovidesatoplevelguidetothemaindatabasesthatdescribetheproteomesofhighereukaryoticorganisms•常使用在质谱的搜库计算算法(Algorithm)•IPI是以蛋白质相似性为基础的不同数据库之间通过映射产生的•两个关键问题–数据库之间如何进行匹配–每个数据集映射结果如何合并到一个数据集中流程下载序列数据数据库所有序列两两之间相似性比对互为最佳匹配的蛋白对匹配百分比要求大于95%所有最佳匹配的蛋白对组成一个类类IPI孤立蛋白已有类的部分片段非有类的部分片段SwissprotRefseqEnsemblTrEMBL聚类互为最佳匹配蛋白对DatabaseBDatabaseAa1,a2,a3…
b1,b2,b3…
a1与databaseB中所有蛋白比对后,得到与a1比对的最佳的为b1b1与databaseA中所有蛋白比对后,得到与a1比对的最佳的为a1a1,b1为互为最佳蛋白的蛋白对IPI序列的确定•IPI的序列采用以下数据库的优先级来选取Swissprot/Refseq/TrEMBL/Ensembl,前题是类中如果有小片段序列,那么所选取的序列必须能包括小片段序列MSIPI•MSIPIisadatabasederivedfromIPIcontainingadditionalinformationaboutcSNPsandN-terminalpeptidesinaformatsuitablef