python - 如何使用 Pandas html 函数解析表格?

标签 python pandas

我正在尝试解析位于 here 的表。使用下面的代码,但它返回多级索引。

url1='aboveurl.htm'

df1=pd.read_html(url1)
df1=df1[0]

最佳答案

df=df[0]
df.columns=df.columns.droplevel()

这将根据您的喜好删除多重索引。

print(df.head())
  Rk                School            Conf   W  L   Pct  W  L   Pct   Off  \
0  1               Clemson  ACC (Atlantic)  12  2  .857  7  1  .875  33.3   
1  2  North Carolina State  ACC (Atlantic)   9  4  .692  6  2  .750  32.2   
2  3            Louisville  ACC (Atlantic)   8  5  .615  4  4  .500  38.1   
3  4           Wake Forest  ACC (Atlantic)   8  5  .615  4  4  .500  35.3   
4  5        Boston College  ACC (Atlantic)   7  6  .538  4  4  .500  25.7   

    Def    SRS   SOS AP Pre AP High AP Rank Notes  
0  13.6  20.62  6.84      5       1       4   NaN  
1  25.2  12.17  5.55    NaN      14      23   NaN  
2  27.4   9.67  3.75     16      14     NaN   NaN  
3  28.3  11.42  6.03    NaN     NaN     NaN   NaN  
4  22.8   9.39  7.08    NaN     NaN     NaN   NaN 

关于python - 如何使用 Pandas html 函数解析表格?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54375375/

相关文章:

python - 为什么我的带有平铺 map 的 pygame 游戏滞后?

Python C-API 使 len(...) 与扩展类一起工作

python - 如果字符串在文本文件中并打印该行,如何在 Python 中检查?

python - MQTT (Mosquitto) over TLS - 某些程序中的证书错误

python pandas - 将值输入到新列中

python - 如果 Pandas 数据框字符串列缺少值,如何小写它?

python - 基于索引数据框使用 Pandas 创建新的(更详细的)数据框

Python:如何从FASTA文件中的滑动窗口打印长度为n的序列?

python - 如何在 Pandas 中动态添加时间桶

python - 使用最新的 Pandas API 计算指数移动平均线