Nginx作为一个高性能的Web服务器和反向代理服务器,广泛用于负载均衡、请求转发等场景。在配置Nginx时,路由匹配规则是非常重要的概念,它决定了请求如何被转发到不同的处理逻辑或后端服务中。本文将详细介绍Nginx的路由匹配规则及其优先级,帮助你更好地理解如何配置路由以及如何调试和优化Nginx配置。

Nginx的路由匹配规则概述

Nginx的配置中,路由匹配通常是通过location指令实现的。Nginx会根据请求的URI(Uniform Resource Identifier)与配置中的location块进行匹配,从而决定请求如何处理。

例如,下面是一个简单的server块,其中包含了多个location块:

1
2
3
4
5
6
7
8
9
10
11
location / {
root /var/www/html;
}

location /images/ {
root /var/www/images;
}

location /static/ {
root /var/www/static;
}
  • 在上面的配置中,location块根据请求的URI(例如/images/abc.jpg)来匹配适当的处理逻辑。每个location块包含一个匹配规则,Nginx会根据规则优先级从上到下逐一检查,直到找到一个最匹配的location块。

Nginx的路由匹配规则类型

Nginx的location指令支持几种不同的匹配模式,不同的模式有不同的匹配逻辑和优先级。理解这些规则的优先级是配置Nginx路由的关键。

精确匹配(=)

精确匹配是指请求的URI必须完全匹配配置中的location块。如果URI与location块的字符串完全一致,则会匹配此location块。

例如:

1
2
3
4

location = /hello {
return 200 "Hello, World!";
}
  • 当访问/hello时,Nginx将返回Hello, World!,其他任何URI(如/hello/)都不会匹配该location块。

前缀匹配(/)

前缀匹配是Nginx中最常见的匹配方式,它会匹配URI的前缀部分。

例如:

1
2
3
4

location /images/ {
root /var/www/images;
}
  • 当请求的URI以/images/开头时(例如/images/photo.jpg),就会匹配此location块。需要注意的是,前缀匹配是从左到右进行匹配的,且Nginx会寻找最长的前缀匹配

正则匹配(~ and ~* and ^~)

Nginx还支持使用正则表达式来进行匹配。正则表达式匹配通常用于更复杂的场景,例如匹配动态的路径或查询参数。

  • ~ 表示区分大小写的正则匹配。
  • ~ *表示不区分大小写的正则匹配。
  • ^~ 前缀匹配标记(~)

例如

1
2
3
4
5
6
7
location ~* \.jpg$ {
root /var/www/images;
}

location /images/ {
root /var/www/images;
}
  • 此规则会匹配所有以.php结尾的请求,并将其转发给PHP-FPM处理。正则匹配会根据location块中的正则表达式从请求的URI中提取信息。

正则匹配优先级

正则匹配的优先级较高,在同一层级下,如果正则匹配成功,Nginx会立即使用该location块,不再继续向下查找其他规则。

例如

1
2
3
4
5
6
7
8

location ~* \.jpg$ {
root /var/www/images;
}

location /images/ {
root /var/www/images;
}

最长前缀匹配

当多个location规则能够匹配同一个请求时,Nginx会选择最长的前缀匹配规则。如果前缀匹配的长度相同,则选择最先出现的规则。

1
2
3
4
5
6
7
8

location /images/ {
root /var/www/images;
}

location /images/photo/ {
root /var/www/photos;
}
  • 对于请求/images/photo/abc.jpgNginx会选择/images/photo/规则,因为它是最长的前缀匹配。

默认匹配(default)

Nginx还提供了一个默认的location规则,用于处理无法匹配任何特定规则的请求。在location块中可以使用default来定义默认行为:

1
2
3
4
5
6
7
8

location / {
root /var/www/html;
}

location /default {
return 404;
}
  • 如果没有任何其他规则匹配的请求,会使用默认的location块进行处理。

Nginx路由匹配规则的优先级

理解Nginx路由匹配的优先级非常重要,下面是Nginx匹配规则的优先级顺序:

  • 精确匹配(=):Nginx首先会检查所有精确匹配的location规则。如果找到匹配,则直接使用该规则。
  • 正则匹配(~ 和 ~):其次,Nginx会查找所有正则匹配的location规则,并按顺序应用正则表达式。Nginx会先匹配区分大小写的正则表达式(~),然后匹配不区分大小写的正则表达式`(~)`。
  • 前缀匹配(/):如果以上规则没有匹配,Nginx会继续查找最长的前缀匹配。最长的前缀匹配会优先被选择。
  • 默认匹配:如果没有任何匹配的规则,Nginx会使用默认的location块(通常是location /)处理请求。

以下展示不同匹配规则的应用:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

server {
listen 80;
server_name example.com;

# 精确匹配
location = /hello {
return 200 "Hello, World!";
}

# 正则匹配
location ~* \.jpg$ {
root /var/www/images;
}

# 前缀匹配
location /images/ {
root /var/www/images;
}

# 默认匹配
location / {
root /var/www/html;
}
}

  • 在这个示例中,Nginx首先检查是否有精确匹配的/hello路径,如果匹配,则返回"Hello, World!"。如果请求路径以.jpg结尾,则会匹配正则表达式规则并返回图片。如果没有匹配到前两个规则,则会尝试匹配/images/路径,最终如果没有匹配到,则会返回默认的/路径。

其他匹配示例

1
2
3
4
5
6
7
8
9
10
location ~ ^/(cn|tw|de|fr|es|pt|jp|it|ar)/ai/object-remover/ {
rewrite ^/(cn|tw|de|fr|es|pt|jp|it|ar)/ai/object-remover/(.*)$ /$1/application/object-remover/$2 break;
proxy_pass https://xxx.xxx.com;

proxy_set_header Host $host;
proxy_set_header X-Real-IP $remote_addr;
proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;

# Rewrite all requests to use j4.flexclip.com as the base URL
}
  • 此规则会匹配所有 /cn/ai/object-remover//tw/ai/object-remover//de/ai/object-remover/ 等的请求。

整段配置的功能是:

  • URI 匹配与重写:

  • 任何匹配 /cn/ai/object-remover//de/ai/object-remover/ 等路径的请求,都将会被重写。

    • 重写后的路径将会变成 /语言代码/application/object-remover/原始路径,例如 /tw/application/object-remover/abc/xyz
  • 请求转发:

  • 请求头设置:

    • 在转发请求时,设置了原始请求的 Host、客户端的 X-Real-IPX-Forwarded-For 头。

总结

Nginx的路由匹配规则通过精确匹配、前缀匹配、正则匹配和默认匹配进行请求处理。理解这些匹配规则的优先级和使用场景,将有助于你更高效地配置Nginx并避免潜在的错误。通过灵活地组合这些匹配规则,你可以实现非常复杂的路由逻辑,满足各种业务需求。