iTOL的样本与分支名称问题
- 看不见的线
- 408
- 2025-02-26 08:44:15
- 原创
在进行iTOL注释时,第一列填写的往往是样本或分支的名称,因为所有注释的内容都需要对应到特定的样本或分支,所以样本和分支名称准确与否尤为重要。
关于样本名称(两项基本原则)
① 样本名称必须与提交的树文件保持一致;
最容易出现的是符号不一致的情况,特别是构建进化树时的序列文件名称与整理注释数据时的样本名称不匹配,比如类似“PA-1”、“PA_1”、“PA 1”的问题 。然后就是Genbank或Assembly号不匹配,比如像“KP347127”和“KP347127.1”,以及 “GCA”和“GCF”等情况。
不过这个问题很容易发现,因为当注释数据中存在树文件没有的样本时,iTOL会进行报错;而注释文件中缺少树文件的某个样本时,该样本的色块也就无法在图中进行展示。

② 样本名称不能携带模板中设定的分隔符(仅针对于模板注释);
假设模板设定的分隔符是空格,样本名称为“E. coli SHP45”,由于空格的存在,样本的“E.”、“coli”和“SHP45”将被认为是三个组分而无法正常识别。关于这部分的内容可以查看 “iTOL模板组成结构解析”。
若要解决这个问题,有两种方法,一是根据样本的名称选择合适的分隔符,比如将分隔符由空格更换为Tab或逗号;二是修改样本名称同时修改进化树, 比较合适的做法是将空格替换为“_”,因为“_”在iTOL中是一种比较特殊的符号,它不会显示在图中,也就是将其内在修改为“E._coli_SHP45”的形式,但在表观上仍显示为“E. coli SHP45”, 这样就避免了空格与分隔符的矛盾。但从原则上来说,修改分隔符是更加一劳永逸的做法。
关于分支名称(两种表示方法)
① 以分支节点ID作为分支名称;
如果生成的进化树里面本身就存在分支节点ID,可以直接填写该名称。

如果生成的进化树里面不包含分支节点ID,可以在iTOL生成的树形图中点击对应的分支,选择“Copy node ID”,并将其粘贴于其它位置,比如txt文件,查看其分支节点ID。

② 以分支节点两侧的样本名称表示分支名称;
如下图所示,“|”、“---”可用于表示分支。其特点是从节点两侧的下游分支中各取一个样本作为这一侧分支的代表。比如INT1这个节点一侧是Gallus_gallus,另一侧包含剩下的4个样本,就可以选择其中1个来进行表示,这就是为什么“Gallus_gallus|Homo_sapiens”能够代表INT1这个分支。

推荐课程
-
点赞 (0人)
- 收藏 (0人)