为了分析特定的 ATA-box 主题,我们使用了来自 Seqan Community Extensions 的 SeqanTcoffee 节点。T-咖啡 (基于树的一致性目标函数比对评估)是一种基于渐进方法的方法,用于提高比对多个序列的准确性。该 如果您感兴趣的是找到密 算法的第一步是生成包含成对比对集的初级库。默认情况下,会生成两个库:使用全局成对比对克隆W 并使用 Lalign 进行局部比对FASTA 软件包. 也可以预 如果您感兴趣的是找到密 先计算成对比对,并使用常见的库,例如爆炸 和妈妈。这就是为什么 T-Coffee 节点有三个输入端口。第一个端口接收多 fasta 文件作为输入,另外两个可选端口可以读取不同文件格式的已对齐序列。
多序列比对:T-咖啡
下一步,将初始库合并为一个主库。从该库计算距离矩阵。该距离矩阵用于计算指导树,该指导树表示序列之间的关系。为了构建树聚类,可以使用以下方法邻居加入 或者联合式微球分析法 在最后一步中,通过按顺序添加序列,从指导树构建多序列比对,从最相似的对开始,然后进展到最远相关的对。
在按顺序添加序列的同时
对齐会进行评分。为此,会使用空位开放和空位延伸惩罚。由于在计算主库的成对分数时已经应用了空位惩罚,因此默认情况下,渐进对齐中的空位开放和空位延伸惩罚设置为较低的值。这些值可以根据目的进行调整。 关的匹配,则应使用更高的空位惩罚来减少空位开放。