转录组

时间:2024-09-07 18:27:15编辑:阿星

转录组学分析流程

1. 数据来源 假设有两个不同组织(PR和SR),每个组织各区三个样本,一共六个样本,利用illumina平台进行转录组测序,得到双端测序数据。 数据原始格式为 .fq ,共有12条测序数据文件(每个样本产生两条)2. 测序数据质量评估 利用fastQC软件对获得的fastq序列文件进行质量分析,生成html格式的结果报告,其中含有各项指标,以下用PR1样本为例。3. 过滤低质量序列 利用Trimmomatic软件除去序列文件中的接头(adapter),并对碱基进行合适的修改,然后对碱基进行修剪,对低质量的序列进行过滤。4. 比对到参考基因组 利用hisat2软件,将fasta序列比对到参考基因组。转录组广义上指在某一生理条件下,细胞内所有转录组产物的集合,包括:mRNA、ncRNA、rRNA等;狭义上指所有mRNA的集合。转录组测序的研究对象为特定细胞在某一功能状态下所能转录出来的所有RNA的总和,主要包括mRNA和ncRNA。转录组具有时间特异性、组织特异性、空间特异性等特点。如果所研究的物种有组装注释质量较好基因组序列,且和该基因组序列比对效率较高,那么可以采用有参转录组的分析策略,直接进行分析。反之,则需要按照无参转录组的分析策略进行转录本组装,构建unigene库,然后进行后续分析。普通转录组测序主要适用于两大类:一是不同的生长阶段或者发育过程;二是不同的环境、药物、病原菌等逆境胁迫处理。

转录组原理、分析步骤介绍

基因课FTP地址: ftp://http://gsx.genek.tv/2020-3-10%E7%9B%B4%E6%92%AD%E4%B8%80%E4%B8%AA%E5%AE%8C%E6%95%B4%E7%9A%84%E8%BD%AC%E5%BD%95%E7%BB%84%E9%A1%B9%E7%9B%AE/ 听张旭东老师的课 -1 比对 把各个样本的fastq格式的reads比对到基因组序列上, 得到一个bam格式的文件(sample.bam) -2 定量 数每个基因上落了几条reads,需要将基因结构画在染色体上 → 基因表达量(表格),又称 原始的reads count 矩阵 以上为 转录组标准分析 (非模式物种的可变剪接、融合基因分析不值当) -3 原始reads count矩阵标准化(细节见转录组原理篇课程) RPKM(PE)/FPKM(SE) (该方法是错的,但得出的结论基本上是对的) TPM (对的) (重复序列处理方式:可以匹配到多个位置。uniq, EM算法,自动用贝叶斯算一个概率)

上一篇:匆匆那年电影在线观看

下一篇:火喉