python - 使用 pandas 或其他 python 模块读取特定列

标签 python csv pandas

我有一个来自 webpage 的 csv 文件. 我想阅读下载文件中的一些列(csv版本可以在右上角下载)。

假设我想要 2 列:

  • 59,在标题中是 star_name
  • header 中的60是ra

但是,出于某种原因,网页的作者有时会决定移动列。

最后我想要这样的东西,记住值可能会丢失。

data = #read data in a clever way
names = data['star_name']
ras = data['ra']

这将防止我的程序在将来再次更改列时出现故障,如果它们保持名称正确的话。

到目前为止,我已经尝试过使用 csv 模块和最近使用 pandas 模块的各种方法。两者都没有运气。

编辑(添加了两行 + 我的数据文件的标题。抱歉,它非常长。)

# name, mass, mass_error_min, mass_error_max, radius, radius_error_min, radius_error_max, orbital_period, orbital_period_err_min, orbital_period_err_max, semi_major_axis, semi_major_axis_error_min, semi_major_axis_error_max, eccentricity, eccentricity_error_min, eccentricity_error_max, angular_distance, inclination, inclination_error_min, inclination_error_max, tzero_tr, tzero_tr_error_min, tzero_tr_error_max, tzero_tr_sec, tzero_tr_sec_error_min, tzero_tr_sec_error_max, lambda_angle, lambda_angle_error_min, lambda_angle_error_max, impact_parameter, impact_parameter_error_min, impact_parameter_error_max, tzero_vr, tzero_vr_error_min, tzero_vr_error_max, K, K_error_min, K_error_max, temp_calculated, temp_measured, hot_point_lon, albedo, albedo_error_min, albedo_error_max, log_g, publication_status, discovered, updated, omega, omega_error_min, omega_error_max, tperi, tperi_error_min, tperi_error_max, detection_type, mass_detection_type, radius_detection_type, alternate_names, molecules, star_name, ra, dec, mag_v, mag_i, mag_j, mag_h, mag_k, star_distance, star_metallicity, star_mass, star_radius, star_sp_type, star_age, star_teff, star_detected_disc, star_magnetic_field
11 Com b,19.4,1.5,1.5,,,,326.03,0.32,0.32,1.29,0.05,0.05,0.231,0.005,0.005,0.011664,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,2008,2011-12-23,94.8,1.5,1.5,2452899.6,1.6,1.6,Radial Velocity,,,,,11 Com,185.1791667,17.7927778,4.74,,,,,110.6,-0.35,2.7,19.0,G8 III,,4742.0,,
11 UMi b,10.5,2.47,2.47,,,,516.22,3.25,3.25,1.54,0.07,0.07,0.08,0.03,0.03,0.012887,,,,,,,,,,,,,,,,,,,,,,,,,,,,,1,2009,2009-08-13,117.63,21.06,21.06,2452861.05,2.06,2.06,Radial Velocity,,,,,11 UMi,229.275,71.8238889,5.02,,,,,119.5,0.04,1.8,24.08,K4III,1.56,4340.0,,

最佳答案

一个简单的方法是像这样使用 pandas 库。

import pandas as pd
fields = ['star_name', 'ra']

df = pd.read_csv('data.csv', skipinitialspace=True, usecols=fields)
# See the keys
print df.keys()
# See content in 'star_name'
print df.star_name

这里的问题是 skipinitialspace 删除了标题中的空格。所以'star_name'变成'star_name'

关于python - 使用 pandas 或其他 python 模块读取特定列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26063231/

相关文章:

python - 多个数据帧上的 Pandas 元素条件操作

python - QFileDialog 和路径中的德语元音变音

python - 获取 OSError : too many open files when running longish test suite on code that uses multiprocessing

Python - 读取 csv 并按列对数据进行分组

r - csv 文件中字符串的 tf-idf

python - 如何使用 pandas 从内部联接获取索引对而不创建结果数据框?

python - 如何使用 Python 将 Excel 图表粘贴到 PowerPoint 占位符中?

python - Tkinter 小部件上的垂直和水平滚动条

r - 如何使用 tidyverse map 在 R 中迭代过滤并写入 csv

python - 用于缩放 pandas 数据框中的列的 lambda 函数返回 : "' float' object has no attribute 'min' "