python-3.x - Python with Pandas——无法从 URL 读取 CSV 文件

标签 python-3.x pandas linear-regression

导入以下库后,我尝试从 here. 读取 CSV 文件

    `import pandas as pd
     import numpy as np
     import matplotlib.pyplot as plt
     from sklearn.linear_model import LinearRegression
     from sklearn.metrics import r2_score
     import statsmodels.api as sm
     from pandas.core import datetools`

    `data = pd.read_csv("https://github.com/marcopeix/ISL-linear-` 
     regression/blob/master/data/Advertising.csv", sep='delimiter', 
     header=None,` `engine='python')`

我可以请求有人解释一下为什么我得到 HTML 标签作为输出吗?

`data.head(5)`

  ` 0
    0   <!DOCTYPE html>
    1   <html lang="en">
    2   <head>
    3   <meta charset="utf-8">
    4   <link rel="dns-prefetch" href="https://assets-...`

最佳答案

如果你进入 Github 页面,你会在右端找到 Raw,如下图所示。单击 Raw 并复制其 url。

enter image description here

这是适合您的网址:

import pandas as pd
data = pd.read_csv("https://raw.githubusercontent.com/marcopeix/ISL-linear-regression/master/data/Advertising.csv")

关于python-3.x - Python with Pandas——无法从 URL 读取 CSV 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53576204/

相关文章:

python-3.x - Python Pandas - 根据索引、列使用字典更新行

python - 合并这些数据框时的 Nan 值

python - 不可散列类型 : 'numpy.ndarray' error in tensorflow

r - 强制step()保留一定的值(value)

python-3.x - 根据产品描述和另一个键为数据框中的所有相似产品/行分配一个键

Python3 Tkinter - 将输入(y)写入子进程的控制台

python - 双星号错误: Invalid Syntax

python - 如何根据其他数据框替换一个 Pandas 数据框列值?

python - 为什么 max() 有时返回 nan 有时忽略它?

Python线性回归,残差的最佳拟合线