为何密码子偏好性指数ENC(Nc)计算结果为空?
- 看不见的线
- 1200
- 2023-12-19 09:24:42
- 原创
在之前的软文中(密码子偏好性研究—常见指数)我们介绍了评价密码子偏好性的指数,在我们全套的密码子偏好性的课程中(【课程】遗传密码子偏好性研究)我们系统介绍了各类指数的含义、计算绘图和文章应用。
最近有客户反馈了一个问题,使用codonW分析得到的.out文件中,有一个基因的ENC(Nc)值是星号,如下图:
系统提示信息如下:
系统提示的原因是该基因中不包含含有8个同义基因的氨基酸,该基因使用的密码子表是table5(https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?chapter=tgencodes#SG5)在codonw中对应4号密码子表,在该密码子表,含有8个同义密码子的氨基酸只有1个Ser,
下表是该基因对应的RSCU值(.blk文件):
由上表我们可以看到,在该基因中有4个Ser,对应4个不同的密码子:UCU(1)、UCA(1)、AGU(1)、AGA(1),总之,该基因中包含具有8个同义密码子的氨基酸,为何提示没有呢?
那就要知道ENC的计算原理,大家可以详细阅读一下参考文件(DOI: 10.1016/0378-1119(90)90491-9),此处我们简要说下大致原理。
首先计算每个氨基酸的纯度(Homozygosity),可以简单理解为频率,计算公式如下
公式1:
n表示氨基酸出现的数目,为所有同义密码子数量的加和(n=n1+n2+……+ni),pi表示第i个同义密码子的频率(pi=ni/n),k是同义密码子的种类。
每个氨基酸都会得到上面这个值。
基于上述结果,计算每条基因的ENC值,ENC计算公式如下:
公式2:
在计算ENC的时候,会根据密码子表将所有的氨基酸进行分类,比如根据table1,2个氨基酸(Met和Trp)具有1个密码子,9个氨基酸(Phe、Tyr、His、Gln、Asn、Lys、Asp、Glu、Cys)具有2个同义密码子,1个氨基酸(Ile)有3个密码子,5个氨基酸(Val、Pro、Thr、Ala、Gly)有4个同义密码子,3个氨基酸(Leu、Ser、Arg)有6个同义密码子,共5个组,分别命名为SF1、SF2、SF3、SF4、SF6。
上述公式中的
就是SFi组所有氨基酸的
平均值。
这就是codonW计算ENC值得原理。
再回到刚开始的问题就很好理解了,因为在该序列中,对应table5,属于F8组的氨基酸只有1个Ser,共4个ser,且分别对应4个不同的密码子,即UCU(1)、UCA(1)、AGU(1)、AGA(1),那么公式1的分子为0,公式2中对应该组的分母为0,所以该氨基酸(SER)被认为不存在,所以对应这条序列的ENC值就不被计算,结果中就以**表示
来自DOI: 10.1016/0378-1119(90)90491-9
关于这个问题大家还有什么疑问或者看法欢迎讨论~
推荐课程
【课程】微生物比较基因组精品系列课——全套自学必入的系统课程
课程链接:微生物比较基因组精品系列课【全套】
【课程】微生物比较基因组与群体进化——基因组变异专题研究
课程链接:微生物比较基因组与群体进化
【课程】微生物分子分型-MLST课程——分型全套(含理论、软件、方法)
课程链接:微生物分子分型-MLST课程
【课程】基因组结构分析神器Easyfig实操精品课
【课程】BRIG绘图——结构比较专题2
【课程】肺炎克雷伯菌基因组学研究综合指南
课程链接:肺炎克雷伯菌基因组学研究综合指南
【课程】微生物基因组生信必学课程
课程链接:微生物基因组生信分析必学课程
【课程】微生物生防菌研究
课程链接:生防菌的系统化研究
专题材料
【资料】耐药专题材料
【资料】生防专题材料
请添加唯那生物技术客服小唯的微信号winnerbio01,备注“耐药专题”或“生防专题”,立马获取。
更多专题推荐
CORPORATE CULTURE
1、耐药毒力专题
-
点赞 (0人)
- 收藏 (0人)