我有一个如下所示的 fasta 文件。我想转换 three letter codes到一个字母代码。我如何使用 Python 或 R 执行此操作?
>2ppo
ARGHISLEULEULYS
>3oot
METHISARGARGMET
期望的输出
>2ppo
RHLLK
>3oot
MHRRM
您的建议将不胜感激!
最佳答案
BioPython 已经内置了字典来帮助进行此类翻译。以下命令将向您显示可用词典的完整列表:
import Bio
help(Bio.SeqUtils.IUPACData)
您要查找的预定义词典:
Bio.SeqUtils.IUPACData.protein_letters_3to1['Ala']
关于python - 如何使用 python 或 R 将三个字母的氨基酸代码转换为一个字母的代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12760271/