如何修改 Smith-Waterman algorithm在 Perl 中使用替换矩阵比对蛋白质?
[需要引用]
最佳答案
我实际上是一名生物信息学研究人员,并且正在等待他自己的生物信息学代码运行,所以我会尝试回答你的问题,即使它提出的问题很糟糕。
我不确定您为什么认为需要“修改”Smith-Waterman 算法。 Smith-Waterman 算法唯一需要比对蛋白质而不是 DNA 的是蛋白质的替换矩阵。查看 BLOSUM 或 PAM。这些是基于很久以前一些生物学家手工比对的序列中各种氨基酸对的替换频率。
为蛋白质序列构建替换矩阵比为 DNA 序列构建替换矩阵要复杂得多。例如,您会期望一种亲水性氨基酸相对频繁地替代另一种氨基酸,因为它通常能够做到这一点而不会导致蛋白质失去功能。但是,您不会期望疏水性氨基酸经常替代亲水性氨基酸,因为这会更彻底地改变蛋白质结构。
如果您将替换矩阵视为输入而不是算法的一部分,那么 Smith-Waterman 算法虽然通常应用于 DNA 或蛋白质,但在技术上是一种通用的字符串对齐算法。
关于perl - 如何使用替换矩阵修改 Smith-Waterman 算法以比对 Perl 中的蛋白质?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1702567/