python - 如何使用 python 或 R 将三个字母的氨基酸代码转换为一个字母的代码?

标签 python r bioinformatics biopython

我有一个如下所示的 fasta 文件。我想转换 three letter codes到一个字母代码。我如何使用 Python 或 R 执行此操作?

>2ppo
ARGHISLEULEULYS
>3oot
METHISARGARGMET

期望的输出

>2ppo
RHLLK
>3oot
MHRRM

您的建议将不胜感激!

最佳答案

BioPython 已经内置了字典来帮助进行此类翻译。以下命令将向您显示可用词典的完整列表:

import Bio
help(Bio.SeqUtils.IUPACData)

您要查找的预定义词典:

Bio.SeqUtils.IUPACData.protein_letters_3to1['Ala']

关于python - 如何使用 python 或 R 将三个字母的氨基酸代码转换为一个字母的代码?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12760271/

相关文章:

r - 在函数中获取 .R 脚本并通过 (RODBC) 传递变量

r - 使用 group_map 将函数应用于分组小标题中的每个组

r - 伪对数变换仍然会从图中删除 0,如何避免?

list - 尝试从 Biopython 获取分类信息

python - 为什么我的shell说: From: too many arguments

python - 如何使用 .whl 文件调用 pyspark 代码?

Python:将 arg 值分配给变量时出现奇怪的错误

python - 从具有不同名称的 SQLAlchemy 模型创建表?

r - 从生物串创建矩阵pairwisealignment BLOSUM

python - 使用python将带有俄语字符的二维数组打印到csv