这是数据快照:
我想查找对包含子字符串“xxxxx”的页面发出的总请求(假设)
每当我尝试对 page_name 变量执行任何字符串操作时,它都会将该属性显示为 float ,并且出现错误。错误如下: Error
我从 csv 文件中获取了数据。它有 600 万条记录。其显示的数据类型为: “语言”:对象, 'page_name':对象, “请求”:int64
我尝试使用以下方法将其转换为字符串:english_data['page_name'].astype(basestring)
这似乎不起作用。
最佳答案
您可以使用 Series
的 str
属性以矢量化方式应用字符串方法。要在 'page_name'
列中查找包含某些字符串 'xxx'
的行,您可以执行以下操作
df.page_name.str.contains('xxx')
要获取该页面的请求总数,您可以执行类似的操作
df.requests[df.page_name.str.contains('xxx')].sum()
关于python - 将 pandas 系列转换为字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33221649/