考虑这个链接:
https://www.reddit.com/r/todayilearned/comments/6x6iz8/til_princess_diana_on_live_tv_shook_the_hand_of/?ref=share&ref_source=link
原来的赞是
http://www.bbc.com/news/av/magazine-39490507/how-princess-diana-changed-attitudes-to-aids
使用 Javascript,如何在不使用 Reddit API 的情况下从第一个链接到达原始链接?
最佳答案
如果您谈论的是在网页中运行的 JavaScript,则不能。您需要使用 Reddit API,或抓取 Reddit 网页。但是,由于跨源安全规则,您不能使用 JavaScript 抓取网页,因此您必须使用 API。
编辑:啊,Paul 刚刚指出您标记了 Node.js;如果您是从服务器执行此操作,则可以进行抓取。查找“使用 node.js 进行抓取”。粗略浏览一下 Google 后,似乎大多数解决方案都涉及下载 Reddit 网页的 HTML,然后使用名为 cheerio 的库对其进行解析。还有这个东西scrape-it看起来很有希望。
关于javascript - 从 reddit URL 获取原始 URL,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45986924/