扩增子测序入门必备小贴士,常见问题我来答(一)
- 看不见的线
- 518
- 2024-07-04 14:12:38
- 文章来源:奥维森基因科技
#基础研究问题#
Q1:设置生物学重复的意义是什么?
生物学重复即样本重复,比如同一处理下有3只小鼠,这3只小鼠就是三个生物学重复。设置生物学重复对试验设计及数据分析都有重要的意义:
1)减少个体差异造成的影响,降低组内误差,并测量组内样本的变异程度,从而增加结果的可信度。
2)检测离群样本:离群样本是指与组内其他样本相比,数值偏离程度非常大的样本,也称作异常样本。离群样本会影响结果的准确性,需要在后续分析中发现并将其去除。
3)统计学分析要求有至少3个以上的生物学重复。
Q2: 一般情况下,设置多少个生物学重复合适?
生物学重复通常建议6个以上,至少3个。
一般情况下,环境样本(比如土壤,水体,植物根系等)及模式动物样本(比如大鼠,小鼠,猪等)建议每组至少6个生物学重复,推荐10个生物学重复。人类肠道、粪便等样本,由于个体差异较大(比如环境,饮食,遗传条件,健康状态等影响),建议每组不少于20个生物学重复。
建议多做生物学重复,若是遇到个别离群样本可以选择性剔除,可避免后期样本数量不够或补送的样本与之前样本重复性不好的情况。
Q3: 对于组内的生物学重复差异较大的情况,如何进行分析?
一般建议:
1)从样本的准备过程进行分析,组内样本除了和设定的分组条件有关外,可能还受到很多其他因素的影响,进而造成分析结果出现差异。
2)对于出现显著离群的个别样本,推测可能为样本自身的原因,建议剔除该样本后,再进行分析。
3)剔除离群样本后如果剩余生物学重复不足,可以补送样本凑足生物学重复。
4)对于取样样方区域较大的环境样本(比如土壤、水体、污泥等),可应用多点采样混合成一个生物学重复的方法减少样本间的个体差异。
#OTU聚类分析#
Q1:什么是OTU表的抽平处理?
抽平是指为了保证样本测序数据量的均一性,在不同的样本测序数据有差距的时候,按照一定数据量或样本最低数据量,将所有样本的数据量随机抽取至统一大小。
Q2: 低丰度的OTU或物种怎么定性阈值?
对于低丰度的OTU没有固定的阈值标准,不同研究情况可以选择不同标准。
对于低丰度的物种,也没有固定的阈值标准。在物种柱状图结果中可以以1%为阈值,显示相对丰度在1%以上的物种及其图例,1%以下的物种则统一归为other一类。
如下图:
Q3: 韦恩图中各组的OTU个数与组内单个样本的OTU个数加和不一致?
对于某一组的OTU计数,采用取并集的方式。只要该组的样本中有一个样本存在该OTU,则认为该组内存在该OTU;若该组的所有样本中都不存在该OTU,即认为该组内不存在该OTU。
如下图:
#物种注释#
Q1: 物种注释常用的数据库有哪些?
16S区域常用的数据库有Silva,RDP,Greengene,NT等。其中Silva数据库由于更新比较及时,因此是目前最常选用的参考数据库之一。Greengene目前较常用于嵌合体去除的参考数据库。
18S区域常用的数据库有Silva,NT等。
ITS区域常用的数据库有Unite,NT等。
功能基因区域一般选择NT数据库进行物种注释。
Q2:物种分类学注释中,常遇到的Unidentified/Unclassified,Uncultured,No_Rank,Others,No blast hit等表示的含义?
Unidentified即未被确认的、未能注释的。Unclassified即未能分类的。在实际分析过程中,并非所有OTU代表序列都能获得属或种水平的分类学信息,也就是在对应的分类学水平尚且属于Unidentified/Unclassified。有时也会遇到某些尚未被充分研究的微生物在较高分类水平(比如门水平)被鉴定为Unidentified或Unclassified。
Uncultured表示那些到目前为止未能在人工条件下获得纯培养的微生物。
No_Rank表示在某个分类水平上没有明确的分类信息或分类名称(与数据库中信息有关)。
Others是在作图时进行定义的。一般热图或柱状图中只展示丰度较高的物种(比如丰度top20的物种),剩下的所有物种被定义为Others(Others的丰度为剩下所有物种丰度的加和)。
No blast hit出现在用BLAST方法进行比对注释的结果中,表示依据比对规则,无法在数据库中比对到参考序列,无法对此OTU作出分类注释。
Q3: 结果中有宿主污染该如何处理?
在微生物多样性研究中,样本中可能会有其他非微生物物种的基因组由于有同源性序列而被扩增出来的情况,在物种注释时这些污染序列会被注释到相应的宿主物种上。这种情况在植物叶片、植物根和动物组织等组织类样本中较明显和常见。
对于易发生宿主污染的样本类型,可选择以下几种方法降低结果中的污染程度:
1)选择使用已经过验证的、较为通用的、能减少宿主污染的引物进行目标区域扩增。例如,16S V5-V7区域常用来扩增植物内生细菌,以减少结果中的植物基因组污染。
2)对于扩增产物中宿主基因组序列和微生物序列的片段大小差异较大的情况,可使用切胶的方法切取微生物序列区域胶条,以剔除宿主基因组扩增序列。
3)当物种注释结果中存在宿主污染时,可剔除注释到宿主物种的OTU,只关注微生物结果。
-
点赞 (0人)
- 收藏 (0人)