javascript - 如何解析网页中的JavaScript?

标签 javascript python-2.7 parsing

我正在尝试使用 Python 2.7 解析一个网页 我想阅读整个 HTML 代码。但结果是这样的...

<html><head><script type="text/javascript">
location.replace( "http://captcha.search.daum.net/captcha/show?url=http%3A%2F%2Fsearch.daum.net%2Fsearch%3Fw%3Dnews%26nil_search%3Dbtn%26DA%3DNTB%26enc%3Dutf8%26cluster%3Dy%26cluster_page%3D1%26q%3D%25EB%25B3%25B4%25EA%25B3%25A0%25EC%2584%259C" );
</script>
</head></html>

我认为该网页正在使用 JavaScript。 如何解析 JavaScript 中包含的整个 HTML 代码?

我的Python代码是这样的...

#-*- coding: utf-8 -*-

import urllib2
from bs4 import BeautifulSoup

url = "http://search.daum.net/search?w=news&nil_search=btn&DA=NTB&enc=utf8&cluster=y&cluster_page=1&q=%EB%B3%B4%EA%B3%A0%EC%84%9C"
page = urllib2.urlopen(url)
soup = BeautifulSoup(page.read())

print soup

最佳答案

似乎需要一些标题才能正确显示此页面。

尝试将请求中的页面标题添加到 soup 命令中,发送与浏览器发送相同的参数以获取您在浏览器中看到的结果

关于javascript - 如何解析网页中的JavaScript?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31890443/

相关文章:

javascript - 如何在不使用 jQuery 的情况下设置选择选项值?

javascript - 计算字符串中的单词

javascript - 如何在 asp 中的剑道 UI 网格字段中编写链接按钮的单击函数

Python - 无法启动新线程

string - 将表解析为字符串后 -> 反转(将字符串解析为表)

javascript - 是否可以像所有针对普通 HTTP 请求的示例一样在 Service Worker 中拦截和缓存 WebSocket 消息?

html - 索引iframe Python

python - 如何在 python 2.7 上的其他列表中添加一个字符串列表

swift - 使用 parse 时遇到 nil 可选问题

使用 Attoparsec 解析简单的分子名称