这是一个生物数据库,http://www.genecards.org/index.php?path=/GeneDecks 通常,如果我输入基因名称(字符串)(例如 TF53)并对其进行顶峰,它将在网页上返回结果。另外,如果用户想将其保存为制表符分隔/XML 文件,也可以选择它。但是,我有一个基因名称列表,其中包含数千个基因名称。如何通过Java程序自动执行这一系列过程?
我知道这个问题可能非常广泛,并且可能有多种方法可以解决。由于只有一点 Java 编程经验,如果有人能建议一种更简单的方法,我真的很感激。谢谢。
最佳答案
其中一种可能性是从列表中按顺序读取基因名称并根据请求相互发送:
http://www.genecards.org/index.php?path=/GeneDecks/ParalogHunter/<your gene name>/100/{%22Sequence_Paralogs%22:%221%22,%22Domains%22:%221%22,%22Super_Pathways%22:%221%22,%22Expression_Patterns%22:%221%22,%22Phenotypes%22:%221%22,%22Compounds%22:%221%22,%22Disorders%22:%221%22,%22Gene_Ontologies%22:%221%22}
(所以基本上模仿了网站的功能)。
例如:
http://www.genecards.org/index.php?path=/GeneDecks/ParalogHunter/TNFRSF10B/100/ {%22Sequence_Paralogs%22:%221%22,%22Domains%22:%221%22,%22Super_Pathways%22:%221%22,%22Expression_Patterns%22:%221%22,%22表型%22:%221%22 ,%22Compounds%22:%221%22,%22Disorders%22:%221%22,%22Gene_Ontologies%22:%221%22}
但是,他们可能不喜欢人们以这种方式使用他们的网站(提交大量自动请求)。您可能想检查他们的政策。另外,其他需要检查的是他们是否有官方 API 可用于批量检索基因信息。
关于java - 如何自动化从网站检索过程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23753612/