RNAseq数据分析VIP免费

下载本文档

阅读 58
下载 10
格式 pdf
大小 951.3 KB
约8页
2024-11-29 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/8页

2/8页

3/8页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

文本预览下载提示常见问题

RNA-Seq 数据分析从原始的数据开始，进行reads 回帖，到拼接转录本，计算表达量，分析差异表达，最后可视化分析结果。 TopHat 是一个把 reads 回帖到基因组上的工具。首先用 Bowtie 把 reads回帖到基因组上，然后通过拼接，我们就可以在基因组上看到一些 reads 堆叠起来的区域，称为 consensus,这些 consensus 可能是一个真的外显子，也有可能是几个外显子拼在一起的，或者一些别的情况。我们知道，经典的剪切位点一般都有GT 和 AG 这样的序列标志，在 consensus 的边界和内部，TopHat 会去找这样的剪切位点，并且得到他们可能的组合。然后对于那些没有被 Bowtie 贴到基因组上的reads,TopHat 会对他们建立索引，去和这些可能的剪切位点比对，这样就把跨越剪切位点的reads 准确地贴到基因组上。一些比较重要的命令行选项。关于插入片段长度的选项：在RNA-Seq 中，会把mRNA 打断成小的片段，然后对片段长度进行iding 筛选后拿去测序，如果选择的片段长度是300bp，两端各测序75bp 的reads,中间的插入片段长度就应该设为150bp. 下面是设置插入片段长度的标准差，如果选择的片段长度比较集中，这个值可以设置的小一些，反之应该设置得大一些。 -G 选项是提供哦呢一个已有的注释文件。如果你分析的基因组被注释得比较好了，最好能够提供这个文件，这时 TopHat 就会先把reads 往转录组上贴，没有贴到转录组上的再往基因组上贴，最后把结果合并起来。我们知道大多数的转录组都是比基因组小得多的，而且junction reads 可以直接贴到转录本上，所以这样回帖的效力和准确度都可以得到提高。标准的Illumina 平台是不分链的，我们无法知道配对的reads 哪个方向和转录本一致，哪个和转录本反向互补。对于分链的数据，也有两种情况，在firststrand 这种分链方法中，第二个read 和转录本方向一致，第一个read 和转录本反向互补，在另一种fr- secondstrand 分链方法中，就刚好反过来了。所以在分析的时候一定要弄清楚自己的数据有没有分链，是怎么分链的。下面是一个模拟的RNA-Seq 数据集，双端测序，有两种处理，每种处理有 3个重复，这里 C 代表处理，R 代表重复，下面用C1R1 进行演示首先，要有参考序列fasta 文件，也就通常说的基因组序列。 TopHat 是利用 Bowtie2 回帖 reads,我们首先需要建立 Bowtie2 的索引文件： bowtie2-build genome....

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

RNAseq数据分析

您可能关注的文档

小辰2 + 关注: 实名认证
内容提供者

出售各种资料和文档

收藏店铺进入空间

RNAseq数据分析VIP免费

RNAseq数据分析

您可能关注的文档

相关文档

热门下载

相关标签