regex - 使用 Nginx 将所有非子域请求重定向到 (https)apex 域

标签 regex linux web nginx

我有一个相当复杂的 Ruby 应用程序,它为客户提供了一个在他们自己选择的子域下可用的仪表板。即:http://mycompany.app.comhttp://myproject.app.com

我还在根域(即 http://app.com)上运行产品网站,我已经购买并使用 Nginx 配置了一个 SSL 证书,它按预期工作,但这给我留下了以下问题场景:

我需要将所有非 https 流量重定向到页面的 https 版本,但去往任何子域的任何请求除外。棘手的是,我确实需要将网站的 www 版本重定向到非 www 版本。

http://app.com             -> https://app.com
http://www.app.com         -> https://app.com
http://nike-admin.app.com !-> https://nike-admin.app.com

到目前为止,这是我在 nginx.conf 中为这个应用程序(真实姓名替换为 app)提出的内容:

upstream unicorn_server {
  server unix:/var/www/<app>/tmp/sockets/unicorn.sock fail_timeout=0;
}

server {
  listen 80;
  listen [::]:80 default_server ipv6only=on;
  server_name <app>.co;

  location / {
    rewrite ^ https://$server_name$request_uri permanent;
  }
}

server {
  server_name <app>.co;
  root /var/www/<app>.co/public;

  client_max_body_size 4G;
  keepalive_timeout 70;
  listen 443 ssl;
  ssl_certificate /etc/nginx/ssl/<app>.crt;
  ssl_certificate_key /etc/nginx/ssl/<app>.key;

  location / {
    try_files $uri @app;
  }

  location @app {
    proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    proxy_set_header Host $http_host;
    proxy_redirect off;
    proxy_pass http://unicorn_server;
  }
}

在第一个 server{} block 中,我明确监听端口 80 上的任何连接并将这些连接重定向到 https 版本,但这是一把双刃剑,因为 SSL 证书仅涵盖顶点域。我不希望将 www 以外的任何子域上的请求重定向到 https 等效项。

我可能会使用正则表达式,但从我在网上看到的情况来看,它似乎不受欢迎?

还有其他方法吗?

最佳答案

您可以使用以下正则表达式:

/^.*?\b(?!www\.)((?:[\w-]+\.)+[\w-]+).*$/

替换为:

https://$1

这是一个regex demo !

  • ^ 断言字符串开头的位置。
  • .*? 在惰性匹配中匹配除新行之外的任意数量的字符。 (逐个字符)
  • \b 断言单词边界位置(\w\W\W\w。)
  • (?! 否定前瞻:断言我们的立场是NOT:
    • www\. 字符序列“www.”.
  • ) 然后进行匹配:
  • ( 打开一个捕获组。这样我们就可以在替换中使用反向引用。
    • (?: 打开一个非捕获组。
      • [\w-]+\. 任何单词字符或连字符(因为连字符可能在域名中)后跟一个点的序列。
    • )+ 一组或多组。
  • [\w-]+ 另一组单词字符或连字符。
  • ) 关闭群组。
  • .* 匹配字符串的其余部分,但它不是域的一部分,因此被忽略。
  • $ 声明字符串末尾的位置。这个 anchor 可能不是必需的,但为了提高可读性还是有好处的。

阅读更多:

关于regex - 使用 Nginx 将所有非子域请求重定向到 (https)apex 域,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/25244171/

相关文章:

javascript - 正则表达式 javascript 简化

regex - 使用可变字符串正则表达式条件删除

linux - Ubuntu 10.04 LTS Cron 作业不工作

security - X-Frame-Options 标题有什么意义?

javascript - Jquery:无法让动画工作

c++ - boost 正则表达式以捕获所有重复的模式

php - 解析 TO header 中符合 RFC 822 的地址

linux - 如何找到长度为 n 的直线

linux - 在 LAMP 堆栈中重命名本地主机 127.0.0.1

django - Recaptcha v3 是后端实现的必要条件吗?