xpath - Google 表格 - 在特定页面上导入 XML 时遇到问题

标签 xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

尝试在 Google 表格中使用 ImportXML 来检索特定的文本,但在搜索我的屁股以寻找答案后遇到了麻烦。

希望这里有人可以帮助解决问题。

页面为:https://www.afi.com.au
我要导入的文本在粉红色框中:

enter image description here

这是我使用代码的地方,我试图检索 XPath,但它不喜欢我所拥有的,我相信这里有人会在心跳中发现问题......

=IMPORTXML("http://www.afi.com.au","//body[@class='entry-homepage type-homepage']/div[@class='page page-home']/div[@class='page__item']/div[@class='js-evo7-component']/div[@class='hero']/div[@class='hero__inner-root rellax']/div[@class='hero__inner']/div[@class='container']/div[@class='grid']/div[@class='grid__item one-third palm-one-whole']/div[@class='hero__share-price']/div[@class='price-number']//text()")

最佳答案

这个解决方法怎么样?在此解决方法中,使用 xpath 检索数据,并使用正则表达式检索值。检索页面时,检索到的数据似乎已更新。所以我用了这个方法。修改后的公式如下。请认为这只是几个答案之一。

示例公式:

在此示例公式中,http://www.afi.com.au放在单元格“A1”中。

=REGEXEXTRACT(IMPORTXML(A1,"//div[@class='js-evo7-component']/@data-config"),"netAssetBacking"":{""price"":""([\d.]+)")
  • 使用 //div[@class='js-evo7-component']/@data-config 的 xpath 检索数据与 IMPORTXML() .
  • 使用 netAssetBacking"":{""price"":""([\d.]+) 的正则表达式检索值与 REGEXEXTRACT() .

  • 结果:

    enter image description here

    引用:
  • IMPORTXML
  • REGEXEXTRACT
  • 关于xpath - Google 表格 - 在特定页面上导入 XML 时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56301462/

    相关文章:

    javascript - 未自动检测到细胞变化

    c# - Selenium 复选框不点击

    php - 如何在 YQL 查询中使用多个 xpath 选择器

    c# - 如何从xPath中删除<a>元素?

    python - 网页抓取 : Extract different recurring classes and their content with Beautiful Soup in Python

    google-sheets - 在 Google 表格中将文本转换为数字

    xml - Spring Beans 应用程序上下文上的 XPath 查询

    node.js - 如何使用 Cheerio 从图表中抓取数据?

    javascript - 是否可以用漂亮的汤从动态图中提取数据?

    google-sheets - 是什么导致从 Google 表格创建的 BigQuery 表中出现 `Failure to read the spreadsheet` 错误?