python - 循环遍历 pandas 数据框，同时使用正则表达式更改行值

标签 python regex python-2.7 pandas for-loop

<小时/>

-编辑-

正如 Daniel Kasatchkow(如下)所建议的那样，我尝试了以下操作:

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

但我得到以下输出:

0    NaN
1    NaN
2    NaN
3    NaN
4    NaN
5    NaN
...

更新 - 仍然无法找到解决方案

最佳答案

尝试这样的事情

import pandas as pd

df = pd.DataFrame(["{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/32/users'}, u'self': {u'href': ...","{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/87/users'}, u'self': {u'href': ..."], columns=['_links'])

df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')

使用正则表达式时，我发现在 http://pythex.org/ 上试用正则表达式很有帮助。

如果数据是字典格式，最好使用 pandas.DataFrame.from_dict 将其转换为 DataFrame

关于python - 循环遍历 pandas 数据框，同时使用正则表达式更改行值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41174249/

上一篇：python - 从列转换为日期时间

下一篇：python - 为 .apply 编写函数来分析整个列？

python pandas数据框按降序排序

python - 正则表达式格式化没有空格的url

Python 导入错误 : No module named resource

python - 为什么没有调用所有基类构造函数？

python 图像库 : Can I simply fill my image with one color?

python - 如何使用 sha-512 生成 hmac？

python - 拆分名称列表，其中两个名字可能有共同的姓氏

C# 将项目符号点字符转换为 HTML 无序列表

python-2.7 - 麻烦让 tensorflow 工作，libcudart.so.8.0 不在路径中