xpath - Google 表格 - 在特定页面上导入 XML 时遇到问题

标签 xpath web-scraping google-sheets google-sheets-formula google-sheets-importxml

尝试在 Google 表格中使用 ImportXML 来检索特定的文本，但在搜索我的屁股以寻找答案后遇到了麻烦。

希望这里有人可以帮助解决问题。

页面为:https://www.afi.com.au
我要导入的文本在粉红色框中:

这是我使用代码的地方，我试图检索 XPath，但它不喜欢我所拥有的，我相信这里有人会在心跳中发现问题......

=IMPORTXML("http://www.afi.com.au","//body[@class='entry-homepage type-homepage']/div[@class='page page-home']/div[@class='page__item']/div[@class='js-evo7-component']/div[@class='hero']/div[@class='hero__inner-root rellax']/div[@class='hero__inner']/div[@class='container']/div[@class='grid']/div[@class='grid__item one-third palm-one-whole']/div[@class='hero__share-price']/div[@class='price-number']//text()")

最佳答案

这个解决方法怎么样？在此解决方法中，使用 xpath 检索数据，并使用正则表达式检索值。检索页面时，检索到的数据似乎已更新。所以我用了这个方法。修改后的公式如下。请认为这只是几个答案之一。

示例公式:

在此示例公式中，http://www.afi.com.au放在单元格“A1”中。

=REGEXEXTRACT(IMPORTXML(A1,"//div[@class='js-evo7-component']/@data-config"),"netAssetBacking"":{""price"":""([\d.]+)")

使用 //div[@class='js-evo7-component']/@data-config 的 xpath 检索数据与 IMPORTXML() .

使用 netAssetBacking"":{""price"":""([\d.]+) 的正则表达式检索值与 REGEXEXTRACT() .

结果:

引用:

IMPORTXML

REGEXEXTRACT

关于xpath - Google 表格 - 在特定页面上导入 XML 时遇到问题，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56301462/

上一篇：excel - Selenium Webdriver (VBA) - 查找元素的属性，其中有相同名称的重复属性

下一篇：xpath - XPath:如果子级存在-获取值，否则-写入空行

相关文章：

javascript - 未自动检测到细胞变化

c# - Selenium 复选框不点击

php - 如何在 YQL 查询中使用多个 xpath 选择器

c# - 如何从xPath中删除<a>元素？

python - 网页抓取 : Extract different recurring classes and their content with Beautiful Soup in Python

google-sheets - 在 Google 表格中将文本转换为数字

xml - Spring Beans 应用程序上下文上的 XPath 查询

node.js - 如何使用 Cheerio 从图表中抓取数据？

javascript - 是否可以用漂亮的汤从动态图中提取数据？

google-sheets - 是什么导致从 Google 表格创建的 BigQuery 表中出现 `Failure to read the spreadsheet` 错误？