我有一个 Pandas DataFrame,我想将 'lat' 和 'long' 列组合成一个元组。
<class 'pandas.core.frame.DataFrame'>
Int64Index: 205482 entries, 0 to 209018
Data columns:
Month 205482 non-null values
Reported by 205482 non-null values
Falls within 205482 non-null values
Easting 205482 non-null values
Northing 205482 non-null values
Location 205482 non-null values
Crime type 205482 non-null values
long 205482 non-null values
lat 205482 non-null values
dtypes: float64(4), object(5)
我尝试使用的代码是:
def merge_two_cols(series):
return (series['lat'], series['long'])
sample['lat_long'] = sample.apply(merge_two_cols, axis=1)
但是,这会返回以下错误:
---------------------------------------------------------------------------
AssertionError Traceback (most recent call last)
<ipython-input-261-e752e52a96e6> in <module>()
2 return (series['lat'], series['long'])
3
----> 4 sample['lat_long'] = sample.apply(merge_two_cols, axis=1)
5
...
AssertionError: Block shape incompatible with manager
我该如何解决这个问题?
最佳答案
熟悉 zip
。在处理列数据时它会派上用场。
df['new_col'] = list(zip(df.lat, df.long))
它比使用 apply
或 map
更简单、更快捷。像 np.dstack
这样的东西比 zip
快两倍,但不会给你元组。
关于python - 如何从 Pandas 中的两列形成元组列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/16031056/