nginx虚拟主机

虚拟主机名使用server_name指令定义,并用于决定某个请求应由哪台虚拟主机处理。虚拟主机名可以使用确切的名字,通配符,或者是正则表达式来定义:
server { listen 80; server_name nginx.org www.nginx.org; ... } server { listen 80; server_name *.nginx.org; ... } server { listen 80; server_name mail.*; ... } server { listen 80; server_name ~^(?<user>.+)\.nginx\.net$; ... }
nginx将以下面顺序检测名字:
  1. 确切的名字;
  2. 以星号起始的通配符名字:*.nginx.org
  3. 以星号结束的通配符名字:mail.*
  4. 正则表达式名字,按在配置文件中出现的顺序遍历。
一旦匹配成功,停止搜索。    

通配符名字

通配符名字只可以在名字的起始处或结尾处包含一个星号,并且星号与其他字符之间用点分隔。所以,www.*.nginx.orgw*.nginx.org都是非法的。不过,上面的两个名字可以使用正则表达式描述:~^www\..+\.nginx\.org$~^w.*\.nginx\.org$。星号可以匹配名字的多个节(各节都是以点号分隔的),比如*.nginx.org不仅匹配www.nginx.org,也匹配www.sub.nginx.org。 有一种形如.nginx.org的特殊通配符,它可以既匹配确切的名字nginx.org,又可以匹配一般的通配符名字*.nginx.org。 都是正则啊  

正则表达式名字

nginx使用兼容PCRE的正则表达式。为了使用正则表达式,虚拟主机名必须以波浪线“~”起始(请求配置的~也是这个原因吧):
server_name ~^www\d+\.nginx\.net$;
否则该名字会被认为是确切的名字,如果表达式含星号,则会被认为是通配符名字(很可能是一个非法的通配符名字)。不要忘记设置“^”和“$”锚点,语法上不是必须的,但是逻辑上是需要的。同时需要注意的是,域名中的点“.”需要用反斜线“\”转义。正则表达式中含有“{”和“}”,那么正则表达式需要被引用,如:
server_name "~^(?<name>\w\d{1,3}+)\.nginx\.net$";
否则nginx就不能启动,错误提示是:
directive "server_name" is not terminated by ";" in ...
命名的正则表达式捕获组在后面可以作为变量使用:
server { server_name ~^(www\.)?(?<domain>.+)$; location / { root /sites/$domain; } }
PCRE使用下面语法支持命名捕获组:
?<name> 从PCRE-7.0开始支持,兼容Perl 5.10语法
?'name' 从PCRE-7.0开始支持,兼容Perl 5.10语法
?P<name> 从PCRE-4.0开始支持,兼容Python语法
如果nginx不能启动,并显示错误信息:  
pcre_compile() failed: unrecognized character after (?< in ...
说明PCRE版本太旧,应该尝试使用?P<name>。捕获组也可以以数字方式引用:
server { server_name ~^(www\.)?(.+)$; location / { root /sites/$2; } }
不过,这种用法只限于简单的情况(比如上面的例子),因为数字引用很容易被覆盖。  

其他类型的名字

如果需要用一个非默认的虚拟主机处理请求头中不含“Host”字段的请求,需要指定一个空名字:
server { listen 80; server_name nginx.org www.nginx.org ""; ... }
  如果server块中没有定义server_name,nginx使用空名字作为虚拟主机名。
同样的情况下,nginx 0.8.48版本以下(含)使用本地主机名作为虚拟主机名。
  如果使用IP地址而不是主机名来请求服务器,那么请求头的“HOST”字段包含的将是IP地址。可以将IP地址作为虚拟主机名来处理这种请求:
server { listen 80; server_name nginx.org www.nginx.org "" 192.168.1.1 ; ... }
  在匹配所有的服务器的例子中,可以见到一个奇怪的名字“_”:
server { listen 80 default_server; server_name _; return 444; }
这没什么特别的,它只不过是成千上万的与真实的名字毫不相干的非法域名中的一个而已。当然,也可以使用“--”、“!@#”等等。 nginx直到0.6.25版本还支持一个特殊的名字“*”,这个名字一直被错误地理解成是一个匹配所有的名字。但它从来没有像匹配所有的名字,或者通配符那样工作过,而是用来支持一种功能,此功能现在已经改由server_name_in_redirect指令提供支持了。所以,现在这个特殊的名字“*”就过时了,应该使用server_name_in_redirect指令。需要注意的是,使用server_name指令无法描述匹配所有的名字或者默认服务器,需要使用listen指令的一个属性来完成这项工作。具体请参考《nginx如何处理一个请求》。可以定义两个服务器都监听*:80和*:8080端口,然后指定一个作为端口*:8080的默认服务器,另一个作为端口*:80的默认服务器:
server { listen 80; listen 8080 default_server; server_name nginx.net; ... } server { listen 80 default_server; listen 8080; server_name nginx.org; ... }
   

优化

确切名字和通配符名字存储在哈希表中。哈希表和监听端口关联,每个端口都最多关联到三张表:确切名字的哈希表,以星号起始的通配符名字的哈希表和以星号结束的通配符名字的哈希表。哈希表的尺寸在配置阶段进行了优化,可以以最小的CPU缓存命中失败来找到名字。nginx首先搜索确切名字的哈希表,如果没有找到,搜索以星号起始的通配符名字的哈希表,如果还是没有找到,继续搜索以星号结束的通配符名字的哈希表。因为名字是按照域名的节来搜索的,所以搜索通配符名字的哈希表比搜索确切名字的哈希表慢。注意.nginx.org存储在通配符名字的哈希表中,而不在确切名字的哈希表中。正则表达式是一个一个串行的测试,所以是最慢的,而且不可扩展。 鉴于以上原因,请尽可能使用确切的名字。举个例子,如果使用nginx.orgwww.nginx.org来访问服务器是最频繁的,那么将它们明确的定义出来就更为有效:
server { listen 80; server_name nginx.org www.nginx.org *.nginx.org; ... }
下面这种方法相比更简单,但是效率也更低:
server { listen 80; server_name .nginx.org; ... }
  如果定义了大量名字,或者定义了非常长的名字,那就需要在http配置块中调整server_names_hash_max_sizeserver_names_hash_bucket_size的值。server_names_hash_bucket_size的默认值可能是32,或者是64,或者是其他值,取决于CPU的缓存行的长度。如果这个值是32,那么定义“too.long.server.name.nginx.org”作为虚拟主机名就会失败,显示下面错误信息:
could not build the server_names_hash, you should increase server_names_hash_bucket_size: 32
出现了这种情况,那就需要将设置值扩大一倍:
http { server_names_hash_bucket_size 64; ...
如果定义了大量名字,得到了另外一个错误:
could not build the server_names_hash, you should increase either server_names_hash_max_size: 512 or server_names_hash_bucket_size: 32
那么应该先尝试设置server_names_hash_max_size的值差不多等于名字列表的名字总量。如果还不能解决问题,或者服务器启动非常缓慢,再尝试提高server_names_hash_bucket_size的值。 如果只为一个监听端口配置了唯一的主机,那么nginx就完全不会测试虚拟主机名了(也不会建立那些名字哈希表)。不过,有一个例外,如果server_name是一个含有捕获组的正则表达式,这时nginx就不得不执行这个表达式以得到捕获组。 来自nginx官网
posted @ 2012-07-14 22:11  X海阳  阅读(370)  评论(0编辑  收藏  举报