我正在尝试编写一段代码来读取网页源代码并获取数据。
网页源代码受到某种保护。我可以通过 Chrome 检查元素获取数据,并将正文复制为元素并保存为 html 文件。然后我就可以毫无问题地获取我想要的数据了。
我在代码中唯一无法做到的就是如何通过代码获取检查元素内容。
最佳答案
所以..我不太明白你的意思,但也许curl就是你正在寻找的?
类似于:
curl https://en.wikipedia.org/wiki/Main_Page > test.html
会给你一个像这样的文件:
<!DOCTYPE html>
<html class="client-nojs" lang="en" dir="ltr">
<head>
<meta charset="UTF-8"/>
<title>Wikipedia, the free encyclopedia</title>
<script>document.documentElement.className...
然后你就可以做任何你想做的事了。 希望这有帮助吗?
如果您使用的机器没有curl: https://curl.haxx.se/
//with chocolatey
choco install curl
//with apt
apt install curl
关于javascript - Chrome通过代码检查元素内容,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43313064/