python - 通过访问 Uniprot 获取蛋白质序列(使用 Python)

标签 python bioinformatics biopython

我有一个蛋白质 ID 列表,我正在尝试使用 Python 从 Uniprot 访问蛋白质序列。 我看到这篇文章:Protein sequence from uniprot protein id python但给出了元素列表而不是实际序列:

代码

import requests as r
from Bio import SeqIO
from io import StringIO

cID='P04637'

baseUrl="http://www.uniprot.org/uniprot/"
currentUrl=baseUrl+cID+".fasta"
response = r.post(currentUrl)
cData=''.join(response.text)

Seq=StringIO(cData)
pSeq=list(SeqIO.parse(Seq,'fasta'))

给出输出:

输出

[SeqRecord(seq=Seq('MQAALIGLNFPLQRRFLSGVLTTTSSAKRCYSGDTGKPYDCTSAEHKKELEECY...SSS', SingleLetterAlphabet()), id='sp|O45228|PROD_CAEEL', name='sp|O45228|PROD_CAEEL', description='sp|O45228|PROD_CAEEL Proline dehydrogenase 1, mitochondrial OS=Caenorhabditis elegans OX=6239 GN=prdh-1 PE=2 SV=2', dbxrefs=[])]

我只是好奇如何才能真正获得序列本身。

最佳答案

[pSeq 中记录的 record.seq]

编辑: 你需要 str(pSeq[0].seq)

关于python - 通过访问 Uniprot 获取蛋白质序列(使用 Python),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/63992865/

相关文章:

python - 在python中对齐DNA序列

python - 在python中使用多线程读取txt文件

python - OpenAI API 错误 : "Module ' openai' has no attribute 'ChatCompletion' , 您的意思是 'Completion' 吗?”

Bash:替换部分文件名

gzip - 如何在 Nim 中打开并读取 .gz 文件(最好逐行)

python - 如何从 pdb 文件中分别获取 X、Y 或 Z 坐标

python - 使用 python 匹配 fasta 文件中的 header

python - 为什么要创建不同的 HOST 和 PORT 变量,然后使用它们来创建 ADDR 变量?

python - 如何从Python中的继承类函数加载变量

python - 如何在 python 中编辑文本 (.fastq) 文件