jquery - 用于下载和解析网页的语言/库?

标签 jquery ruby parsing clojure web-crawler

什么语言和库适合用脚本来解析和下载少量网络资源?

例如,一些网站发布伪播客,但不是正确的 RSS 提要;他们只是定期发布一个 MP3 文件和一个包含播放列表的网页。我想编写一个脚本来定期运行并解析链接和播放列表信息的相关页面,下载 MP3,并将播放列表放在 MP3 标签中,以便它在我的 iPod 中很好地显示。我也可以编写很多类似的应用程序。

您会推荐什么语言?我希望脚本在 Windows 和 MacOS 上运行。以下是一些备选方案:

  • JavaScript。这样我就可以使用 jQuery 进行解析。不过我不知道 jQuery 是否可以在浏览器之外工作。
  • python 。可能很好的图书馆支持做我想做的事。但我不喜欢 Python 语法。
  • ruby 。我以前用 Ruby 做过一些简单的事情(手动解析)。
  • Clojure。因为我想花点时间在上面。

你最喜欢用什么语言和库来做这件事?为什么?是否有适用于其他语言的类似 jQuery 的不错的库?

最佳答案

如果您想花一些时间使用 Clojure(在我看来这是个好主意!),请提供 Enlive一个镜头。 GitHub 描述如下:

a selector-based (à la CSS) templating and transformation system for Clojure — Read more

除了可用于模板之外,它还是一个功能强大的网络抓取库;查看 this tutorial 的开头部分对于一些简单的抓取示例。 (第三个是纽约时报首页,其实没那么简单。)

如果您在 Web 上寻找其他教程,也可以找到这些教程; Enlive 本身带有一些文档/示例。 (此外,代码总共不到 1000 行,而且可读性很强,不过我想对于刚接触该语言的人来说,这可能不那么重要。)

关于jquery - 用于下载和解析网页的语言/库?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2376093/

相关文章:

ios - 如何从 JSON 解析图像

javascript - 在 python 中解析 JavaScript 参数值

ruby-on-rails - rake db :migrate 的奇怪错误

javascript - 是否存在结合创建 html 元素和附加到目标的方法?

javascript - 灯箱 5 在 ajax 页面加载中不起作用

javascript - 将重复的 JQuery 代码转换为干净的代码

ruby - 在 Ruby 中将 excel 列字母转换为整数

ruby-on-rails - 计算 Rails 中记录之间的平均天数

javascript - 八月错误的 Date.parse javascript

javascript - 如果可以动态添加或删除输入字段,如何按键对从 HTML 表单发布的值进行分组