我正在抓取网站的详细信息,我需要动态创建一个 JSON 对象。我怎样才能像我提供的示例那样实现这一点。如果不是 JSON,那么我怎样才能制作一个多 -也来 self 的代码的维数组。
import requests
import bs4 as bs
urls = 'http://dl5.lavinmovie.net/Series/'
url = requests.get(urls).text
soup = bs.BeautifulSoup(url, 'lxml')
title = soup.find_all('a')
for i in title:
if(i.text != '../' and ".mp4" not in i.text):
urll = urls+i.text
# arr.append(i.text)
urll1 = requests.get(urll).text
soupp1 = bs.BeautifulSoup(urll1, 'lxml')
season = soupp1.find_all('a')
print(i.text)
for j in season:
if(j.text != '../'and ".mp4" not in j.text):
urlla = urll+j.text
urll2 = requests.get(urlla).text
soupp2 = bs.BeautifulSoup(urll2, 'lxml')
quality = soupp2.find_all('a')
print(j.text)
for k in quality:
if(k.text != '../' and ".mp4" not in k.text):
urllb = urlla+k.text
urll3 = requests.get(urllb).text
soupp3 = bs.BeautifulSoup(urll3, 'lxml')
episode = soupp3.find_all('a')
print(k.text)
for m in episode:
if(m.text != '../' and ".mp4" not in m.text):
print(m.text)
系列->季节->质量->剧集。
这是我想要的 JSON 文件的流程图。 我编写的代码遍历嵌套链接并找到我需要的所有数据,但我无法从中创建多维数组。
我的代码递归地打开所有链接并抓取我想要的文本。我需要解决的只是如何以嵌套方式添加所有内容。
最佳答案
在Python中,任何类型的数据都可以存储到list
中和dictionaries
,几乎不需要创建多维数组或向量。
Series->Seasons->Quality->Episodes.
只需查看流程图(如您所说),您就可以按如下方式解决方法:
episodes
将是 list
Quality(dict)
内Seasons(dict)
内Series(dict)
内
你必须阅读《制作》dicts of dicts
和dicts of lists
以及如何在 Python 中存储数据。
关于python - 如何在多维数组中添加元素,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57284788/