我有一个蛋白质 ID 列表,我正在尝试使用 Python 从 Uniprot 访问蛋白质序列。 我看到这篇文章:Protein sequence from uniprot protein id python但给出了元素列表而不是实际序列:
代码
import requests as r
from Bio import SeqIO
from io import StringIO
cID='P04637'
baseUrl="http://www.uniprot.org/uniprot/"
currentUrl=baseUrl+cID+".fasta"
response = r.post(currentUrl)
cData=''.join(response.text)
Seq=StringIO(cData)
pSeq=list(SeqIO.parse(Seq,'fasta'))
给出输出:
输出
[SeqRecord(seq=Seq('MQAALIGLNFPLQRRFLSGVLTTTSSAKRCYSGDTGKPYDCTSAEHKKELEECY...SSS', SingleLetterAlphabet()), id='sp|O45228|PROD_CAEEL', name='sp|O45228|PROD_CAEEL', description='sp|O45228|PROD_CAEEL Proline dehydrogenase 1, mitochondrial OS=Caenorhabditis elegans OX=6239 GN=prdh-1 PE=2 SV=2', dbxrefs=[])]
我只是好奇如何才能真正获得序列本身。
最佳答案
[pSeq 中记录的 record.seq]
编辑:
你需要 str(pSeq[0].seq)
关于python - 通过访问 Uniprot 获取蛋白质序列(使用 Python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63992865/