Uniprot蛋白数据库VIP免费

下载本文档

阅读 115
下载 10
格式 ppt
大小 5.19 MB
约24页
2024-10-19 发布于江苏
收藏
评论
点赞(0)
海报
举报

1/24页

2/24页

3/24页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/24

文本预览下载提示常见问题

Uniprot蛋白数据库之前，世界上最广泛使用的蛋白数据库为瑞士的SWISS-PROT计划建立的数据库，NHGRI的项目主任PeterGood介绍说。但由于编辑详细蛋白结构数据库时间紧迫，再加上资金短缺，SWISS-PROT无法跟上基因组学飞速前进的步伐，Good说。这种形势导致了TrEMBL的产生，这是计算机注释的SWISS-PROT分支数据库，目的是暂时储存日益增多的蛋白质结构信息。另外，美国的蛋白信息资源（ProteinInformationResource，PIR)也独立编辑其自己的数据库。后来，这三个计划的领导人将展开合作，将三大数据库合并为一个。联合起来的力量将“减少重复工作，由此也可以节省不必要的费用。”SWISS-PROT的领导人、英国剑桥欧洲生物信息研究院的RolfApweiler说道。，UniProt将是SWISS-PROT、TrEMBL和PIR三大数据库的最佳整合一个集中化的数据库十分重要，密歇根大学的肿瘤学家SamirHanash对此表示同意。他同时也是人类蛋白组组织（HumanProteomeOrganisation）的主席。然而，Hanash提醒说，UniProt只是一个开始，还需要建立其它的数据库来储存有关蛋白质何时何处在机体中活动的信息，他说。（2002年）这句话不仅代表了Uniport数据库，也是代表了整个生物信息学，科研本就是站在巨人的肩膀上发展的，那么这个肩膀也得与时俱进了！Uniport的前世今生UniProt（全称UniversalProtein），它整合了三个老字号数据库（Swiss-Prot、TrEMBL和PIR-PSD）的数据。是目前信息最丰富、资源最广的免费蛋白质数据库（注意没有之一哦！）。UniProt知识库（UniProtKB）是收集蛋白质功能信息的中心枢纽，具有准确，一致和丰富的注释。除了捕获每个UniProtKB条目强制的核心数据（主要是氨基酸序列，蛋白名称或描述，分类数据和引用信息）外，还会添加尽可能多的注释信息。这包括广泛接受的生物本体论，分类和交叉引用，以及以实验数据和计算数据的证据归属形式的注释质量的明确指示。蛋白质序列从哪里来？由UniProtKB提供的超过95％的蛋白质序列来源于已经提交给公共核酸数据库，EMBL-Bank/GenBank/DDBJ数据库（INSDC）的编码序列（CDS）的翻译。所有这些序列以及作者提交的相关数据都自动整合到UniProtKB/TrEMBL中。除翻译的CDS之外，UniProtKB蛋白质序列可以来自：1、在PDB数据库。2、通过直接蛋白质测序实验获得的序列，通过Edman降解或MS/MS实验并提交给UniProtKB/Swiss-Prot。只有约5％的UniProtKB/Swiss-Prot条目包含通过直接蛋白质测序获得的序列数据（具有关键字的条目列表'Directproteinsequencing'）。3、从文献（igPRF或其他期刊扫描项目）扫描的序列。4、从基因预测，没有提交的序列EMBL-Bank/GenBank登录/DDBJ。5、序列来源于内部基因预测，在非常特殊的情况下。Uniprot主要功能查询蛋白质序列以及其他多种信息查询蛋白质组找相似的蛋白质对比多种蛋白质序列查询蛋白质相关文献网站的网址为http://www.uniprot.org/，先来看看全景图吧！这个数据库可以大致分为6个主题部分，如上图红框所示1、UniProtKB；2、UniRef；3、UNIParc；4、Proteomics；5、Supportingdata。6、检索区这次我们先游览第一个主题，也是最经典的部分。（其实其他的主题我自己还没有完全搞明白）1、UniProtKB（UniversalProteinKnowledgebase）它是经过专家校验的数据集，又分成两部分（绿框部分，不用担心，这些都是免费的，不是那种滥收费园中园）1.1、Swiss-Prot(经过人工检查、校验的条目)高质量的、人工注释的、非冗余的数据集；主要来自文献中的研究成果和E-value校验过的计算分析结果。截止到昨天Swiss-Prot包含556,196条记录，（2010年8月10日有519,348条记录，7年后增加了3万多条记录，评价每天大约10几条记录，速度还是比较慢的。）1.2、TrEMBL(计算机自动注释的、未经人工校验的条目)该数据主要是利用计算机对大量基因组数据流进行分析注释（人工校验速度暂时无法跟上数据的产生速度）。截止到昨天2017年03月19日TrEMBL包含98,705,220条记录，（2010年8月10日有110,636,205条记录，7年后数据量减少了很多，估计是去掉了很多重复的数据）另外大家会注意到这里的数据是Swiss-Pro数据的100多倍。进入方式多种多样，1、主页默认...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

Uniprot蛋白数据库

Uniprot蛋白数据库之前，世界上最广泛使用的蛋白数据库为瑞士的SWISS-PROT计划建立的数据库，NHGRI的项目主任PeterGood介绍说

但由于编辑详细蛋白结构数据库时间紧迫，再加上资金短缺，SWISS-PROT无法跟上基因组学飞速前进的步伐，Good说

这种形势导致了TrEMBL的产生，这是计算机注释的SWISS-PROT分支数据库，目的是暂时储存日益增多的蛋白质结构信息

另外，美国的蛋白信息资源（ProteinInformationResource，PIR)也独立编辑其自己的数据库

后来，这三个计划的领导人将展开合作，将三大数据库合并为一个

联合起来的力量将“减少重复工作，由此也可以节省不必要的费用

”SWISS-PROT的领导人、英国剑桥欧洲生物信息研究院的RolfApweiler说道

，UniProt将是SWISS-PROT、TrEMBL和PIR三大数据库的最佳整合一个集中化的数据库十分重要，密歇根大学的肿瘤学家SamirHanash对此表示同意

他同时也是人类蛋白组组织（HumanProteomeOrganisation）的主席

然而，Hanash提醒说，UniProt只是一个开始，还需要建立其它的数据库来储存有关蛋白质何时何处在机体中活动的信息，他说

（2002年）这句话不仅代表了Uniport数据库，也是代表了整个生物信息学，科研本就是站在巨人的肩膀上发展的，那么这个肩膀也得与时俱进了

Uniport的前世今生UniProt（全称UniversalProtein），它整合了三个老字号数据库（Swiss-Prot、TrEMBL和PIR-PSD）的数据

是目前信息最丰富、资源最广的免费蛋白质数据库（注意没有之一哦

UniProt知识库（UniProtKB）是收集蛋白质功能信息的中心枢纽，具有准确，一致和丰富的注释

除了捕获每个UniProtKB条目

读万卷书 + 关注: 实名认证
内容提供者

各类经典PPT文档分享

收藏店铺进入空间

Uniprot蛋白数据库VIP免费

Uniprot蛋白数据库

您可能关注的文档

相关文档

热门下载

相关标签