python - 将 pandas 系列转换为字符串

这是数据快照:

我想查找对包含子字符串“xxxxx”的页面发出的总请求(假设)

每当我尝试对 page_name 变量执行任何字符串操作时，它都会将该属性显示为 float ，并且出现错误。错误如下: Error

我从 csv 文件中获取了数据。它有 600 万条记录。其显示的数据类型为: “语言”:对象， 'page_name':对象， “请求”:int64

我尝试使用以下方法将其转换为字符串:english_data['page_name'].astype(basestring)

这似乎不起作用。

最佳答案

您可以使用 Series 的 str 属性以矢量化方式应用字符串方法。要在 'page_name' 列中查找包含某些字符串 'xxx' 的行，您可以执行以下操作

df.page_name.str.contains('xxx')

要获取该页面的请求总数，您可以执行类似的操作

df.requests[df.page_name.str.contains('xxx')].sum()

关于python - 将 pandas 系列转换为字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33221649/