我有以下 html 解析器:
from HTMLParser import HTMLParser
class MLStripper(HTMLParser):
def __init__(self):
self.reset()
self.fed = []
def handle_data(self, d):
self.fed.append(d)
def get_data(self):
return ''.join(self.fed)
def strip_tags(html):
s = MLStripper()
s.feed(html)
return s.get_data()
我想在以下 data.frame 上使用它:
df = pd.DataFrame([['<br> test </br>', 1]], columns=('body', 'ticketID'))
我的假设是它会像这样工作:
for row in df.iterrows():
input = row['body']
print(strip_tags(input)
但这给了我一个类型错误。有什么想法哪里出了问题吗?
最佳答案
来自 ( Docs ):
DataFrame.iterrows()
Iterate over DataFrame rows as (index, Series) pairs.
这样你就得到了索引和行。
工作代码:
for index, row in df.iterrows():
input = row['body']
print(strip_tags(input))
关于python - 在 Python 中使用解析器时出现类型错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41853354/