python - 使用python计算肽单同位素

标签 python calculator chemistry

我正在制作肽单同位素计算器,但有一些无法解决的问题。

import re

aminoacid = {
        "I": "C6H13NO2",
        "L": "C6H13NO2",
        "K": "C6H14N2O2",
        "M": "C5H11NO2S",
        "F": "C9H11NO2",
        "T": "C4H9NO3",
        "W": "C11H12N2O2",
        "V": "C5H11NO2",
        "R": "C6H14N4O2",
        "H": "C6H9N3O2",
        "A": "C3H7NO2",
        "N": "C4H8N2O3",
        "D": "C4H7NO4",
        "C": "C3H7NO2S",
        "E": "C5H9NO4",
        "Q": "C5H10N2O3",
        "G": "C2H5NO2",
        "P": "C5H9NO2",
        "S": "C3H7NO3",
        "Y": "C9H11NO3"
}

acid = input('Sequence: ')

s = re.findall('([A-Z][a-z]?)([0-9]*)', formula)

monoisotopic = {'S': 31.972, 'C': 12.0000, 'H': 1.0078, 'O': 15.9949, 'N': 14.0031}

weight = 0
for elem, count in s:

    #For singular elements
    if count=='':
        count = 1

    weight = weight + int(count) * monoisotopic[elem]

print('[M + H]+ : ', weight-(len(acid)-1)*18.0105+1.0078)

print('# of amino acids : ', len(acid))

如果我输入单个氨基酸,如“A”,效果很好。但是当我输入“AILWNG”之类的序列时,程序无法识别它。我怎样才能让这个程序识别两个或多个氨基酸?

最佳答案

如果我们将程序分成单独的函数,可能会有所帮助。首先,我们定义氨基酸和(相关)原子的原子量:

aminoacid = {
    'I': 'C6H13NO2',
    'L': 'C6H13NO2',
    'K': 'C6H14N2O2',
    'M': 'C5H11NO2S',
    'F': 'C9H11NO2',
    'T': 'C4H9NO3',
    'W': 'C11H12N2O2',
    'V': 'C5H11NO2',
    'R': 'C6H14N4O2',
    'H': 'C6H9N3O2',
    'A': 'C3H7NO2',
    'N': 'C4H8N2O3',
    'D': 'C4H7NO4',
    'C': 'C3H7NO2S',
    'E': 'C5H9NO4',
    'Q': 'C5H10N2O3',
    'G': 'C2H5NO2',
    'P': 'C5H9NO2',
    'S': 'C3H7NO3',
    'Y': 'C9H11NO3'
}
monoisotopic = {
    'S': 31.972,
    'C': 12.0000,
    'H': 1.0078,
    'O': 15.9949,
    'N': 14.0031
}

然后可以定义一个函数来计算氨基酸(或任何其他原子)的重量:

from re import findall as refindall

def molecular_weight(molecule):
    return sum(
        monoisotopic[atom] * int(num or '1')
        for atom, num in refindall(r'([A-Z][a-z]*)(\d*)', molecule)
    )

然后我们可以总结氨基酸的分子量,例如:

def proteine_mass(proteine):
    return sum(molecular_weight(aminoacid[char]) for char in proteine)

例如:

>>> proteine_mass('WATER')
733.3594
>>> proteine_mass('AILWNG')
762.4109000000001

(当然这不是H2O,可能上面的蛋白质不存在)

关于python - 使用python计算肽单同位素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54688466/

相关文章:

python - subprocess.wait() 不等待 Popen 进程完成(使用线程时)?

python - Python 中是否有相当于 SQL Age() 的函数?

python - Pandas 切片的奇怪行为

C中使用堆栈的计算器

java - 将化学式转换为其 iupac 名称

java - JMol XYZ 的单位

python - python查看grpc服务器状态的方法

使用参数的 C 计算器不输出任何内容

mysql - 添加 2 个文本框的值以在其中之一中显示结果

python - 生成小配体的构象异构体但保留正确的芳香性