这是一个示例 pandas DataFrame:
import pandas as pd
import numpy as np
data = {"first_column": ["item1", "item2", "item3", "item4", "item5", "item6", "item7"],
"second_column": ["cat1", "cat1", "cat1", "cat2", "cat2", "cat2", "cat2"],
"third_column": [5, 1, 8, 3, 731, 189, 9]}
df = pd.DataFrame(data)
df
first_column second_column third_column
0 item1 cat1 5
1 item2 cat1 1
2 item3 cat1 8
3 item4 cat2 3
4 item5 cat2 731
5 item6 cat2 189
6 item7 cat2 9
我想根据 10 =< x =<1000“过滤”第三列。
如果我做的大于或等于 10,这是:
df['greater_than_ten'] = df.third_column.ge(10).astype(np.uint8)
如果我做不到1000,就是:
df['less_than_1K'] = df.third_column.le(1000).astype(np.uint8)
但我不能同时进行这些操作,即
df['both'] = df.third_column.le(1000).ge(10).astype(np.uint8)
我也不能按顺序尝试这些操作。
如何同时使用 .ge()
和 .le()
?
最佳答案
您可以使用 between()
取而代之的是您感兴趣的系列。
df['both'] = df.third_column.between(10, 1000).astype(np.uint8)
屈服
>>> df
first_column second_column third_column both
0 item1 cat1 5 0
1 item2 cat1 1 0
2 item3 cat1 8 0
3 item4 cat2 3 0
4 item5 cat2 731 1
5 item6 cat2 189 1
6 item7 cat2 9 0
关于python - 过滤 Pandas 数据框列时如何使用.le()和.ge()?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43328868/