java - 如何自动化从网站检索过程

标签 java web

这是一个生物数据库,http://www.genecards.org/index.php?path=/GeneDecks 通常,如果我输入基因名称(字符串)(例如 TF53)并对其进行顶峰,它将在网页上返回结果。另外,如果用户想将其保存为制表符分隔/XML 文件,也可以选择它。但是,我有一个基因名称列表,其中包含数千个基因名称。如何通过Java程序自动执行这一系列过程?

我知道这个问题可能非常广泛,并且可能有多种方法可以解决。由于只有一点 Java 编程经验,如果有人能建议一种更简单的方法,我真的很感激。谢谢。

最佳答案

其中一种可能性是从列表中按顺序读取基因名称并根据请求相互发送:

http://www.genecards.org/index.php?path=/GeneDecks/ParalogHunter/<your gene name>/100/{%22Sequence_Paralogs%22:%221%22,%22Domains%22:%221%22,%22Super_Pathways%22:%221%22,%22Expression_Patterns%22:%221%22,%22Phenotypes%22:%221%22,%22Compounds%22:%221%22,%22Disorders%22:%221%22,%22Gene_Ontologies%22:%221%22}

(所以基本上模仿了网站的功能)。

例如:

http://www.genecards.org/index.php?path=/GeneDecks/ParalogHunter/TNFRSF10B/100/ {%22Sequence_Paralogs%22:%221%22,%22Domains%22:%221%22,%22Super_Pathways%22:%221%22,%22Expression_Patterns%22:%221%22,%22表型%22:%221%22 ,%22Compounds%22:%221%22,%22Disorders%22:%221%22,%22Gene_Ontologies%22:%221%22}

但是,他们可能不喜欢人们以这种方式使用他们的网站(提交大量自动请求)。您可能想检查他们的政策。另外,其他需要检查的是他们是否有官方 API 可用于批量检索基因信息。

关于java - 如何自动化从网站检索过程,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23753612/

相关文章:

java - 两个输出流?

java - org.hibernate.Session 的 Save 方法未将数据保存在数据库中

javascript - 为什么我当前在 reactjs 中的项目在 package.json 脚本中包含这个 "theme": "lessc --js src/App.less src/App.css",?

html - 将 html 类结合到 css 中以便于设计?

ruby-on-rails - 如何检查是否在网站上找到了图像?

java - 如何将图标添加到 BlackBerry 应用程序的标题栏?

java - 使用 mp4Parser java 库动态查找和剪切 mp4 http 流

java - 是否有与 Python 的 'enumerate' 函数等效的 Java?

javascript - Reactjs 动态类名与 React 路由器

php - 如何从网页调用python脚本