是否有任何 Web API 可以获取 URL 并返回该页面的可读内容?或者有没有任何 JavaScript 库可以做到这一点?
无法安装 Node.js 或任何服务器端应用程序。
最佳答案
这实际上是一个非常困难的问题。此类问题通常意味着您希望排除侧边栏和类似的“噪音”元素。这通常是通过机器学习计算机领域内的不同训练集来解决的,并且开发起来并不容易。
话虽如此 - 看看:
- http://www.alchemyapi.com/api/scrape/
- http://www.readability.com/developers/api
- http://www.diffbot.com/
这应该可以帮助您充分了解该空间,以便您能够更好地搜索问题域。
关于javascript - 在线阅读服务?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14110699/