python - arff加载到Python时数据中出现字母

标签 python pandas weka arff

我已经使用这段代码将一个 arff 文件加载到 python:

import pandas as pd, scipy as sp
from scipy.io import arff
datos,meta = arff.loadarff(open('selectividad.arff', 'r'))
d = pd.DataFrame(datos)

当我使用 head 函数查看数据框时,它是这样的: enter image description here

但是,正如我们在下面看到的那样,arff 文件中不存在那些“b”: https://gyazo.com/3123aa4c7007cb4d6f99241b1fc41bcb 这里有什么问题?非常感谢

最佳答案

对于一列,应用以下代码:

data['name_column'] = data['name_column'].str.decode('utf-8') 

对于数据框,应用:

str_df = df.select_dtypes([object])
str_df = str_df.stack().str.decode('utf-8').unstack()

关于python - arff加载到Python时数据中出现字母,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49806439/

相关文章:

python - 如何使用python将三个csv文件数据写入一个具有一个日期列和三个数据列的csv文件

machine-learning - 如何从Weka的GUI中获取SVM的权重?

python - 在cython中使用C函数读写文件中的数组

python - 如何导入文件名包含 '-'字符的python模块

python - 使用python以指定格式绘制大数据

machine-learning - weka 中的测试文件是否需要与训练相同或更少数量的特征?

java - 提高 WEKA 多层感知器模型的准确性

python - 正则表达式python数据提取

python - 如何从 pandas 对称数据框中提取元组

Python 复制特定行和列并更新现有模板文件