初学者的问题。
我正在使用 BS4 抓取房屋广告并使用 Pandas 分析后续数据。
我有一个包含多个列的 DataFrame。这个问题只考虑其中一列,看起来像,
district | ... |
----------------
A | ... |
B | ... |
C | ... |
... | ... |
我有一个与地区相关的链接列表。例如A区,链接看起来像www.site.com/city/district-A/
.
我想用 <a href="www.site.com/city/district-A/">A</a>
替换列中的每个地区名称(例如“A”) .我最好使用正则表达式进行替换,因为我有各种各样的地区名称和地区链接。
更困难的是,地区名称是非 ASCII 的,而链接是 ASCII 的。
我该怎么办?
最佳答案
看来你需要apply
format
:
df = pd.DataFrame({'district':['A','B','C']})
df['url'] = df.district.apply('<a href="www.site.com/city/district-{0}/">{0}</a>'.format)
print (df)
district url
0 A <a href="www.site.com/city/district-A/">A</a>
1 B <a href="www.site.com/city/district-B/">B</a>
2 C <a href="www.site.com/city/district-C/">C</a>
关于 python Pandas : Use regex to replace strings with hyperlink,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42837067/