宏病毒组技术与宏基因组有什么不同吗?
用宏基因组来研究病毒是前几年用的比较多的方法,但是缺点很明显,宏基因组数据95%以上为宿主基因组污染,而细菌基因组DNA含量是病毒DNA的15倍左右,因此在剩下的不足5%,甚至通常不到1%的数据中,病毒DNA的reads比例也非常低,造成检测到的病毒DNA远低于样品中实际的病毒水平。由此可见,通过宏基因组的数据对病毒进行研究,会造成对病毒组认识的偏差。因而,去除宿主和细菌DNA后,单独对病毒组进行研究非常有必要。
所以利用宏病毒组的方法来研究病毒的优势就非常明显,也越来越受到相关科研团队的关注。宏病毒组的特点是只对样本中的病毒组序列进行研究,这样的话就避免掉了宿主以及细菌序列的影响,能够极大的提高数据的利用率。
然而,病毒组数据分析也面临如下挑战:(1)由于病毒非常小、进化速度快且难于培养,因此对病毒的研究相对困难。此外病毒缺乏类似于细菌16S rRNA基因序列的系统发育标记,对于环境病毒组的研究变得更为复杂。要对环境样本中的所有病毒进行研究,不可避免的会受到样本中其他物种DNA的影响;(2)病毒数据库不够丰富,病毒群落的基本结构和功能性研究还比较难。
由于人体各个部分的微环境不同,因此不同部位的病毒组均存在差异。其次,年龄、饮食习惯以及宏基因组中的其他组分等因素也会影响病毒组的组分构成。利用二代测序技术对病毒组进行研究,不仅可以在健康人群和患病个体中发现新的病毒,也可以研究特定疾病与病毒的关系。病毒组研究最有意思的发现之一是病毒与微生物组中的其他组分相互作用,尤其是细菌。病毒与细菌之间的相互影响可以增强或减弱抗病毒免疫反应从而控制病毒感染。这种影响是相互的,病毒也可以反过来调控细菌感染。对于在宿主特定遗传环境下病毒与其他微生物的相互作用及其对病人健康状态的影响的研究才刚刚起步,有待进一步深入,但目前的研究结果表明病毒及其他微生物对免疫反应的调节会影响感染的结果。
近两年,许多科学家越来越多的开始关注病毒组,在实验技术的改进和数据库的扩充上有重要的进展。但总体来说,目前病毒组研究的报道要么是基于人类基因组计划产出的全基因组测序数据,要么样本量有限,还有许多未知的领域有待探索。
想了解更多关于“宏病毒组”的相关信息,百度或微信搜索“基因帮”。
什么是宏基因组?
2011年,当时我被分配到了老东家综合楼514室的医口业务线小RNA组混。
做小RNA测序服务业务的技术支持。
某日,办公室里,同事A不知哪根筋堵塞,突发灵魂一问:“到底什么是小RNA?怎么定义?”
同事B比较皮,答案脱口而出:"就是很小的RNA呗!"
见此回答,大家一笑,也没把这个当回事,倒是有人看不下去了。
同事C:“这说法有点太不负责啊。小RNA一般包括miRNA、piRNA和siRNA三种RNA,这三种都是小RNA,咱公司小RNA测序针对的是18-40nt长度的小RNA,以miRNA为主。”
本着实事求是的心,那天晚上回去查了下相关资料。
小RNA的定义为:长度小于200nt的RNA,通常是非编码RNA。
发现同事B和C的回答都正确,但是都较为片面。不过,如果说这是一道价值2分的名词解释题的话,相较之下,同事B能得1分,同事C估计最多0.5分。
因为人家问的是小RNA是什么,人没问你小RNA包括哪几种,小RNA也不止这三种,而且小RNA的长度也说错了。
接下来问题来了,“根据同事B的推理方式,什么是宏基因组?”
可能会有人说:“宏基因组就是很’宏观‘的基因组啊!”
没错!太聪明了,一学就会啊。
不过呢,能给出这种回答的一般分两个极端,一种是什么也不知道瞎说,一种是真正理解此概念的洒家。
凡事向美好看齐,我姑且把上面的回答默认为是后者。
看似漫不经心,其实包藏玄机,但考试的时候这么回答注定是要得0分的。
可能这时候又有人会说:“宏基因组不是研究微生物群落的么?还宏什么?
宏基因组在维基百科上的定义是环境样本中基因组的总和 。
由于宏基因组学主要针对的是微生物群落研究,所以这个概念现在主要指特定环境样本中的微生物基因组总和 (图1)。
进一步对”宏“这个字的理解,可参考古代圣贤王阳明12岁的时候作的一首诗,叫《蔽月山房》:
山近月远觉月小,
便道此山大于月。
若人有眼大于天,
当见山高月更阔。
王阳明12岁的时候,思绪就如此放荡不羁了,那么不妨效仿一下。
环境样本可大可小,如果你以一座城市、一个省、一个国家或者是整个地球作为环境样本呢?(注意:这里假设有外星人,不然地球就是总体,而不是抽样得来的样本了。)
是不是可以说这里面所有的生物的基因组都可以归为宏基因组的一部分?
所有生物的基因组,岂不是包括人、马、牛、蟑螂、跳蚤、大肠杆菌……等的DNA。
很严格地根据定义,这也是宏基因组。
这样我们就很容易理解宏基因组的这个宏是什么意思了。
既然研究基因组的话,我们一个一个物种去测序就行了,为什么还会有宏基因组测序?
这存在技术层面的原因,需要解释一下为什么现在认为的宏基因组学研究主要针对的是环境微生物样本,而不是针对城市、国家的所有生物这种样本。
研究城市里所有DNA?
呃,……首先,难以操作不说,经费也是一个问题,而且城市里动植物与人的生态关系,多数我们肉眼可见,可以单独提取DNA去研究。
然而, 微生物之间的关系是肉眼不可见的,只能用实验的方式去了解,而且只有不到1%的微生物是可以分离培养,传统方法对微生物世界的认识主要集中于实验室纯培养的微生物物种,所以对微生物群落作为整体的认识远远落后于对其个体的研究。而宏基因组方法无须对微生物进行纯培养,从而可全面地对某一环境的微生物进行研究。
宏基因组就是宏观层面的基因组,这就没错了。只不过这些方法在现实中针对的是微生物。
既然叫宏,还有另一层意思。
就是说,宏基因组系列测序方法,可针对整个生物圈放眼量,小起指甲泥垢,中到瘤胃肠道(图2),大到山川河流,这些样本皆可收编测序。
作为豪放派湿人,此时我竟然情不自禁了,故做诗一首。
生物本无圈,奈何地球圆。
问君何所向?且看君划环。
上下十千米,纵横八万里。
耳鼻口肠胃,山海皆E 源。
这需要解释一下。
生物圈,地表生物有机体及其生存环境的总称。包括海平面以下深度约11千米、海平面以上10千米的范围。地球的周长,大约40000余公里(沿赤道),绕经线一圈大约39900多KM。毛泽东诗词有云:“坐地日行八万里,巡天遥看一千河。” E源,有两个意思,第一,我们带头大哥新创立的一个品牌叫E源基因,第二层意思,即所有来自Earth的样本。
布莱特杨
2019年3月24日