<小时/>
-编辑-
正如 Daniel Kasatchkow(如下)所建议的那样,我尝试了以下操作:
df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')
但我得到以下输出:
0 NaN
1 NaN
2 NaN
3 NaN
4 NaN
5 NaN
...
更新 - 仍然无法找到解决方案
最佳答案
尝试这样的事情
import pandas as pd
df = pd.DataFrame(["{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/32/users'}, u'self': {u'href': ...","{u'users': {u'href': u'qwer://abc\.x-data\.orc/v1/i/87/users'}, u'self': {u'href': ..."], columns=['_links'])
df._links.str.findall('qwer://abc\\\.x-data\\\.orc/v1/i/\d+/users')
使用正则表达式时,我发现在 http://pythex.org/ 上试用正则表达式很有帮助。
如果数据是字典格式,最好使用 pandas.DataFrame.from_dict 将其转换为 DataFrame
关于python - 循环遍历 pandas 数据框,同时使用正则表达式更改行值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41174249/