生物学重复

来源:小张科研知识分享

生物学重复:指对同一个处理组中独立来源的多个样本分别进行独立测定分析,是整个实验的完全重复,如将具有同一基因型的多个细胞株进行独立地测定。由于遗传和环境等因素的影响会引起有机体的个体差异,因此需要采用生物重复的实验设计方法来消除该差异。


技术重复:指对同一样本进行重复地检测分析,例如同一份细胞中抽提的蛋白质进行三次质谱检测,或者对同一RNA-seq样本测序3次。与生物学重复相比,技术重复的测量变异程度较小,从而可以减少实验中的分析变异,将对同一份样本产生高重复性的测量结果 。


简单来讲,生物重复是生物级别的重复,一般都是生物样本的重复。而技术重复,更多的是参数测定环节的重复,一般是对同一生物样本进行多次测定。


为什么要做生物学重复?


(1)能够消除组内误差:生物学重复可以测量变异程度;

(2)增强结果的可靠性:测序的样本数越多,越能够降低背景差异;

(3)检测离群样本:异常样本的存在,会严重影响测序结果的准确性,通过计算样本间的相关性可以发现异常样本,将其排除。

 早期由于测序费用高昂,基于高通量测序的组学研究(如RNA-seq)可以不设置生物学重复,或通过将若干生物学重复混合为一个样本后测序的策略,来部分弥补个体差异的影响(如 BMC genomics等SCI期刊上的相关研究普遍采取这个策略)。但随着测序价格不断下降,对多个生物重复样本的单独进行测序也逐渐成为高通量测序项目的趋势,并且许多期刊对生物学重复的个数也有明确的要求。

   2011年7月Hansen发表的文章表明生物学差异是基因自身表达的特性,与检测技术的选择以及数据处理的方式无关。如果不设生物学重复,高影响因子的杂志可能会因此而拒稿。


不同组学应该设置多少个生物学重复合适?


一般说来不同的组学因为得到的结果性质不同,需要设置不同的重复数以满足科学性和合理性。在动植物研究和医学研究还有所不同,临床上个体差异更大(比如环境,饮食,遗传条件,健康状态等影响),所以需要更多的生物学重复以消除组内个体差异。以下提供了一些不同组学实验设计中的生物学重复个数,各位可以根据课题组和实验设计的实际情况作为参考。


RNA类测序


动植物:一般要求生物学重复≥3,推荐5个重复;

医学:细胞样本一般要求生物学重复≥3;小鼠、大鼠样本推荐6-10个重复,最低不少于3个重复;临床样本推荐30个重复以上。

单细胞测序类项目,考虑成本,推荐生物学重复≥3。


蛋白质组学


动植物:一般要求生物学重复≥3,推荐5个重复;

医学:细胞样本一般要求生物学重复≥3;小鼠、大鼠样本推荐6-10个重复,最低不少于3个重复;临床样本推荐30个重复以上。


代谢组学实验


相较于基因和蛋白,代谢物处于生命活动的下游,动态波动性大。因此需要更多生物学重复来增加数据的可靠性和说服力。

1.植物样本:最少6次,建议8次生物学重复;

2.模式动物及微生物样本:最少8次,建议10次生物学重复;

3.临床样本:至少30次生物学重复以上, 建议50次以上。


微生物类


一般情况下,自然环境中(比如土壤,根系,植物等)及模式动物(比如大鼠,小鼠等)建议每组至少5个生物学重复,一般推荐10个生物学重复;若是人类肠道粪便等样品,由于个体之间差别较大(比如环境,饮食,遗传条件,健康状态等影响),建议加大取样量,每组不少于30个生物学重复(取样少,可能会导致组内差异大于组间差异则项目无意义),推荐50个以上。宏基因组测序重复数目考虑成本可以适当减少,最少不少于3个,临床样本个体差异大,建议不少于30个重复。


注意:

1、样本不能pooling,不能反复冻融。

2、如果将多个样本混在一起建库测序,多个样本则变成了一个样本,仍是无生物学重复的。