尝试在 Google 表格中使用 ImportXML 来检索特定的文本,但在搜索我的屁股以寻找答案后遇到了麻烦。
希望这里有人可以帮助解决问题。
页面为:https://www.afi.com.au
我要导入的文本在粉红色框中:
这是我使用代码的地方,我试图检索 XPath,但它不喜欢我所拥有的,我相信这里有人会在心跳中发现问题......
=IMPORTXML("http://www.afi.com.au","//body[@class='entry-homepage type-homepage']/div[@class='page page-home']/div[@class='page__item']/div[@class='js-evo7-component']/div[@class='hero']/div[@class='hero__inner-root rellax']/div[@class='hero__inner']/div[@class='container']/div[@class='grid']/div[@class='grid__item one-third palm-one-whole']/div[@class='hero__share-price']/div[@class='price-number']//text()")
最佳答案
这个解决方法怎么样?在此解决方法中,使用 xpath 检索数据,并使用正则表达式检索值。检索页面时,检索到的数据似乎已更新。所以我用了这个方法。修改后的公式如下。请认为这只是几个答案之一。
示例公式:
在此示例公式中,http://www.afi.com.au
放在单元格“A1”中。
=REGEXEXTRACT(IMPORTXML(A1,"//div[@class='js-evo7-component']/@data-config"),"netAssetBacking"":{""price"":""([\d.]+)")
//div[@class='js-evo7-component']/@data-config
的 xpath 检索数据与 IMPORTXML()
. netAssetBacking"":{""price"":""([\d.]+)
的正则表达式检索值与 REGEXEXTRACT()
. 结果:
引用:
关于xpath - Google 表格 - 在特定页面上导入 XML 时遇到问题,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56301462/