python - 如何从文本文件创建数据框

标签 python pandas dataframe nlp text-mining

我有一个文本文件。文件中的每一行看起来像这样,但长度不同:

negative فينو اهبل ابن اهبل
positive فينو اهبل ابن اهبل
neutral فينو اهبل ابن اهبل

当我使用 pandas.read_table 时,它会将其读入一列,我尝试将文件转换为 Excel 或 CSV,但仍将其转换为一列

我希望它是一个两列的数据框,其中 negative 在它自己的列中,其余的在另一列中。

最佳答案

您可以像这样构建自己的解析器:

代码:

def parse_my_file(filename):
    with open(filename) as f:
        for line in f:
            yield line.strip().split(' ', 1)

测试代码:

df = pd.DataFrame(parse_my_file('file1'))
print(df)

结果:

          0                   1
0  negative  فينو اهبل ابن اهبل
1   neutral  فينو اهبل ابن اهبل
2  positive  فينو اهبل ابن اهبل

关于python - 如何从文本文件创建数据框,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44089653/

相关文章:

python - Pandas模糊组汇总统计

r - 根据给定的顺序对数据框进行排序

python - pandas 操作是否与 groupby 互补(相反)?

python - 如何从 Python 中的子进程获取返回码和输出?

python - wxPython 中的分组事件

python - Pandas to_csv 删除值

python - 添加每组缺失的小时数时无法从重复轴重新索引

python - 提取嵌套括号内的字符串

dataframe - Pandas 数据框乘以一个系列

python - 根据与行值的比较在 DataFrame 中创建新列