我正在尝试使用 Scrapy 提取特定的文本片段。
这是我的代码
item['movie_director'] = movie.xpath(substring-before(substring-after(span[1]/text(), 'Director : '), '.')).extract()
格式为: 导演:导演姓名。
我只想提取这个: 董事姓名
但是当我设置爬虫时,出现此错误:全局名称“substring”未定义。
我认为包含了子字符串的使用。有没有办法导入这个?
感谢您的帮助。
最佳答案
您的xpath
表达式需要是字符串
,即将其放在引号下:
item['movie_director'] = movie.xpath("substring-before(substring-after(span[1]/text(), 'Director : '), '.')").extract()
关于python - Scrapy全局名称子字符串未定义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/29625161/