python - 来自uniprot蛋白质id python的蛋白质序列

标签 python bioinformatics biopython

我想知道是否有办法从 uniprot 蛋白质 id 中获取蛋白质序列。我确实检查了一些在线软件,但它们允许一次获得一个序列,但我有 5536 个 vlues。 biopython中是否有任何包可以做到这一点?

最佳答案

uniprot 的所有序列都可以从“http://www.uniprot.org/uniprot/”+ UniprotID +.fasta 访问。您可以获得任何序列

import requests as r
from Bio import SeqIO
from io import StringIO

cID='P04637'

baseUrl="http://www.uniprot.org/uniprot/"
currentUrl=baseUrl+cID+".fasta"
response = r.post(currentUrl)
cData=''.join(response.text)

Seq=StringIO(cData)
pSeq=list(SeqIO.parse(Seq,'fasta'))

cID 可以是列表或单个条目,如果您循环访问错误列表,只需在下载之间添加延迟,尽量不要使服务器饱和。希望能帮助到你

关于python - 来自uniprot蛋白质id python的蛋白质序列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52569622/

相关文章:

php - Python 脚本中关于 str(sys.argv[1]) 的错误

python - 在 python 中,如何在使用 Bio.Phylo.draw() 生成系统发育树时更改叶节点的字体大小?

Python v3(随 secret 码生成器)

python - Django Forms - 'readonly' 使用安全吗?

r - 如何在R中逐行读取非常大的文件匹配模式

python - 从微笑文件中检索所有分子

python - pandas.apply 期望输出形状(传递值的形状是(x,),索引暗示(x,y))

python - 去掉输出中的括号

python - 将 "None"替换为返回 NameError 的对象

python - 如何轻松地在列表中找到具有给定类属性的类实例?