json - 用尖叫 Frog 提取Json数据

标签 json regex web-scraping seo

我使用 Screaming Frog 作为从 URL 生成的 Json 中提取数据的一种方式。
生成的 Json 是这种形式:

{"ville":[{"codePostal":"13009","ville":"VAUFREGE","popin":"ouverturePopin","zoneLivraison":"1300913982","url":""},{"codePostal":"13009","ville":"LES BAUMETTES","popin":"ouverturePopin","zoneLivraison":"1300913989","url":""},{"codePostal":"13009","ville":"MARSEILLE 9EME ARRON","popin":"ouverturePopin","zoneLivraison":"1300913209","url":""}]}

我在 Screaming Frog 的 Custom > Extraction 中使用这个正则表达式来提取“codePostal”的值。

“ zip 号”:”。*?”

问题是它没有提取任何东西。
当我在 regex101 中测试我的正则表达式时,它似乎是正确的。

你知道什么是错的吗?
谢谢。

问候。

最佳答案

您是否尝试保存输出以了解 ScreamingFrog 看到的内容?无论您的 RegEx 是否有效,都无关紧要 - 不是一开始。

也就是说,不要忘记 SF 是一个基于 Java 的工具,因此它是 reg ex 使用的引擎,因此请确保使用正确的方言测试您的正则表达式。

关于json - 用尖叫 Frog 提取Json数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55007498/

相关文章:

javascript - 如何访问本地明文js文件并保存为变量

具有离线 map 和数据库的 Android 应用程序

javascript 循环思想 bootstrap

javascript - 如何为文本区域创建正则表达式?

node.js - Scraperjs 与页面交互

java - Jackson Object Mapper 读取值(以字节为单位)返回一个所有字段都初始化为 null 的对象

javascript - JS RegExp 从第二次出现 <h2> 标记开始,并包含其后的所有内容

java - Pattern.compile() 抛出异常

python - 加载数据后网页抓取页面

java - Selenium xpath : Finding first table in the tables list