这是一个由两部分组成的问题
1) 我有一个包含许多子目录的域,其中一些是公共(public)的,一些是私有(private)的。我想限制来自谷歌分析中私有(private)目录的数据。我想排除来自 domain.com/private/manager
例如。
domain.com/product/welcomeback.aspx?xnav=welcome&rd=1
domain.com/private/manager/welcomeback.aspx?xnav=welcome&rd=1
domain.com/private/manager/cart.aspx?cart_id=20120
仅应包含第一个网址。我尝试在 Google Analytics 中设置自定义过滤器,方法是在请求 URI 字段上使用正则表达式 .*\/private\/manager\/.*
但它不起作用。
2) 我在一个 URL 中有很多参数,并且想要排除没有特定参数的 URL
http://www.domain.com/vp/welcomeback.aspx?other=welcome&rd=1
http://www.domain.com/category/product1.aspx?txi=15626&xnid=TopNav_product&xnav=TopNav
http://www.domain.com/product2.aspx?txi=17104&xnid=TopNav_product+(linked+item)_product&subjectid=TopNav
http://www.domain.com/product3.aspx?pg=17104&page=TopNav_product+(linked+item)_product&xnav=TopNav
我只想包含参数 pg、page、SubjectId 和 TopicID。
因此,按照该逻辑,仅包含 2,3 和 4 url,而不包含第一个。
我有 .*\(\&|\?.*((topicid|pg|subjectid|page)).*
但它不起作用。
有人可以帮我解决这个正则表达式吗?
最佳答案
当您设置排除过滤器时,请使用更简单的正则表达式(无需将整个字符串与正则表达式模式匹配,例如在 Java matches()
中,因为 GA 正则表达式会检查 < em>部分匹配):
使用
(^|/)private/manager(/|$)
这匹配:
(^|/)
- 字符串开头或/
private/manager
- 文字字符串(^|/)private/manager(/|$)
(/|$)
-/
符号或字符串结尾。
关于谷歌分析中的正则表达式查找特定标签和文件夹,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/39251736/