python - 如何使用 python 或 R 将三个字母的氨基酸代码转换为一个字母的代码？

我有一个如下所示的 fasta 文件。我想转换 three letter codes到一个字母代码。我如何使用 Python 或 R 执行此操作？

>2ppo
ARGHISLEULEULYS
>3oot
METHISARGARGMET

期望的输出

>2ppo
RHLLK
>3oot
MHRRM

您的建议将不胜感激!

最佳答案

BioPython 已经内置了字典来帮助进行此类翻译。以下命令将向您显示可用词典的完整列表:

import Bio
help(Bio.SeqUtils.IUPACData)

您要查找的预定义词典:

Bio.SeqUtils.IUPACData.protein_letters_3to1['Ala']

关于python - 如何使用 python 或 R 将三个字母的氨基酸代码转换为一个字母的代码？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/12760271/

相关文章：

r - 在函数中获取 .R 脚本并通过 (RODBC) 传递变量