我正在尝试转换 this将表格放入 pandas
DataFrame
到目前为止,我已经完成了以下工作
import pandas as pd
url = 'http://www.scb.se/sv_/Hitta-statistik/Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/Befolkningsstatistik/25788/25795/Helarsstatistik---Riket/26046/'
df = pd.read_html(url,thousands=' ')
df2= df[0]
我的问题是 pandas
无法识别索引值 0
是 header 。我还希望列值 År
成为索引值。
最后,我想将 Folkmängd
列值绘制为 Y
并将 År
值绘制为 X
,在线图中。
提前谢谢你。
最佳答案
这应该接近你想要的:
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib
matplotlib.style.use('ggplot')
url = 'http://www.scb.se/sv_/Hitta-statistik/Statistik-efter-amne/Befolkning/Befolkningens-sammansattning/Befolkningsstatistik/25788/25795/Helarsstatistik---Riket/26046/'
table = pd.read_html(url,thousands=' ', header=0, index_col=0)[0]
table["Folkmängd"].plot(color='k')
plt.show()
哪个应该给你这样的东西:
关于python - Pandas - 阅读 HTML,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35241210/