Google Docs ImportXML 的 XPath 查询

标签 xpath xml-parsing google-sheets salesforce

我正在尝试从销售人员中提取一系列笔记,我真的只需要这些笔记的正文,而且我真的宁愿避免手动复制这些笔记。

我已将笔记的 URL 存入 Google 文档电子表格中,并尝试使用 ImportXML 函数提取特定信息,但我似乎无法正确获取 xpath 查询。

经过我自己的一些尝试和相当多的研究(我是一个完全的初学者,所以我可能只是在寻找错误的东西),我想出了一个像这样的 xpath 查询:

//div[@class="pbSubsection"]//td[@class="data2Col"][5]//text

这会导致解析错误。

我还发现我可以在 Chrome 和开发人员工具中打开注释,找到该表并右键单击选择复制 XPath,这给了我:

//*[@id="ep"]/div[2]/div[2]/table/tbody/tr[5]/td[2]

即使我将//text 附加到末尾。显然这并不像我所要求的那样万无一失;我在这里缺少什么东西或者我可以使用一些工具来找出这些查询的问题吗?我尝试过 XMLQuire,但运气不佳。

话又说回来,如果有人想查看页面代码(匆忙更改以删除敏感信息)并具体告诉我我缺少什么,我会满足于此:

https://www.dropbox.com/s/peo5i47du1vtsmu/test.html

我想要提取的文本是:

teamviewer 12345 Server: Customer Name, ST Username: administrator Password: password1

有什么想法吗?预先感谢您的宝贵时间。

最佳答案

"//div[@class='pbSubsection']//td[@class='data2Col']/text()"

产量

['Connection Details',
 'teamviewer 12345 \r',
 '\r',
 'Server: Customer Name, ST\r',
 'Username: administrator\r',
 'Password: password1']

关于Google Docs ImportXML 的 XPath 查询,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/28920188/

相关文章:

google-apps-script - 如何预填Google表单复选框?

python - 如何在html中为div和strong编写xpath

google-apps-script - 使用 CC 从工作表单元格添加多个用户

xslt - XPath 中是否有独占 OR 'XOR'?

java - XML 将节点值解析为字符串

python - 在 Python 的 For 循环中迭代生成器

java - 如何将本地 xml 文件转换为 org.ksoap2.serialization.SoapObject?

javascript - 以编程方式在 Google Spreadsheet 嵌入式折线图中显示数据标签

xpath - 使用Xpath和HtmlAgilityPack查找具有包含一个或多个特定单词的内部文本的所有元素

html - 如何通过XPath选择表条目