Apache (Web服务器软件)

Apache(音译为阿帕奇)是世界使用排名第一的Web服务器软件。它可以运行在几乎所有广泛使用的计算机平台上,由于其跨平台和安全性被广泛使用,是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩充,将Perl/Python等解释器编译到服务器中。

 

Apache HTTP Server(简称Apache)是Apache软件基金会的一个开放源码的网页服务器,可以在大多数计算机操作系统中运行,由于其多平台和安全性被广泛使用,是最流行的Web服务器端软件之一。它快速、可靠并且可通过简单的API扩展,将Perl/Python等解释器编译到服务器中。 [2] 

Apache HTTP服务器是一个模块化的服务器,源于NCSAhttpd服务器,经过多次修改,成为世界使用排名第一的Web服务器软件。

它可以运行在几乎所有广泛使用的计算机平台上。

Apache源于NCSAhttpd服务器,经过多次修改,成为世界上最流行的Web服务器软件之一。Apache取自“a patchy server”的读音,意思是充满补丁的服务器,因为它是自由软件,所以不断有人来为它开发新的功能、新的特性、修改原来的缺陷。Apache的特点是简单、速度快、性能稳定,并可做代理服务器来使用。

本来它只用于小型或试验Internet网络,后来逐步扩充到各种Unix系统中,尤其对Linux的支持相当完美。Apache有多种产品,可以支持SSL技术,支持多个虚拟主机。Apache是以进程为基础的结构,进程要比线程消耗更多的系统开支,不太适合于多处理器环境,因此,在一个Apache Web站点扩容时,通常是增加服务器或扩充群集节点而不是增加处理器。到目前为止Apache仍然是世界上用的最多的Web服务器,市场占有率达60%左右。世界上很多著名的网站如Amazon、Yahoo!、W3 Consortium、Financial Times等都是Apache的产物,它的成功之处主要在于它的源代码开放、有一支开放的开发队伍、支持跨平台的应用(可以运行在几乎所有的Unix、Windows、Linux系统平台上)以及它的可移植性等方面。

Apache的诞生极富有戏剧性。当NCSAWWW服务器项目停顿后,那些使用NCSAWWW服务器的人们开始交换他们用于该服务器的补丁程序,他们也很快认识到成立管理这些补丁程序的论坛是必要的。就这样,诞生了Apache Group,后来这个团体在NCSA的基础上创建了Apache。

Apache (Web服务器软件)_第1张图片Apache Server配置界面

Apacheweb服务器软件拥有以下特性:

1.支持最新的HTTP/1.1通信协议

2.拥有简单而强有力的基于文件的配置过程

3.支持通用网关接口

4.支持基于IP和基于域名的虚拟主机

5.支持多种方式的HTTP认证

6.集成Perl处理模块

7.集成代理服务器模块

8.支持实时监视服务器状态和定制服务器日志

9.支持服务器端包含指令(SSI)

10.支持安全Socket层(SSL)

11.提供用户会话过程的跟踪

12.支持FastCGI

13.通过第三方模块可以支持JavaServlets

如果你准备选择Web服务器,毫无疑问Apache是你的最佳选择。

相关模块

1.SSO Module - LemonLDAP 

LemonLdap 是 Apache 的一个实现了 Web SSO 的模块,可处理超过 20 万的用户。

2.并发限制模块 - limitipconn

limitipconn 是一个 Apache 的模块,用来限制每个 IP 的并发连接数。支持 Apache 1.x 和 2.x。

3.日志监控模块

Apache Live Log 是一个 Perl 编写的模块,可以在浏览器上直接实时的通过 Ajax 技术浏览和监控 Apache 的 日志文件。

4.负载均衡模块

mod_backhand 是一个Apache 的负载平衡模块 。它定义了每个请求的HTTP重定向在一个异构的Apache服务器群集。每个请求的处理,并贯穿了一套“候选人的职能” ,以确定哪些服务器是最适合的回应。请求然后代理到该服务器。设施已到位,让你写您自己的动态加载决策算法。一切有关的要求和当前可用的资源可用于决策过程。

5.图像处理模块

mod_gfx 是一个对图像进行即时处理的 Apache 模块,提供很多灵活的接口,包括:

Resizing

Resampling

Watermarking

Cropping

以后还将添加如下功能:

Add Text

Rotate

Draw Polygons

6. 压缩模块

mod-gzip-disk 是一个使用磁盘进行存储预压缩页面的 Apache 模块,与 mod-gzip 不同的是不需要每次请求的时候重新压缩。

使用方法:

gunzip -c mod_gzip_disk-0.5.tar.gz | tar -xvpf -

cd mod_gzip_disk

sudo make module

7. 音乐模块

mod_musicindex 是一个 Apache 用来处理音频文件的模块,类似 Perl 的 Apache::MP3,支持音频格式包括:MP3, Ogg Vorbis, FLAC, or MP4 / AAC ,可根据不同的音频属性进行排序列表、在线播放、下载、构建播放列表和搜索等,提供 RSS 和 Podcast 输出,支持多 CSS 和包下载。

8.LDAP 认证模块

LDAP 是轻量级目录访问协议,基于 X.500 标准,但更简单,并可根据需要进行定制。mod_psldap 是 Apache 用来执行 LDAP 认证和授权的模块。同时可通过 Web 界面进行简单的 LDAP 管理

9.带宽限制模块

mod_cband 是一个用来限制请求占用带宽的 Apache 模块。

10.CGI V8 引擎包

v8cgi 是一个很小的 C ++ 和 JS 和 C 文件集合,允许开发者在服务器端使用 JS 的模块,基本功能包括:IO, GD, MySQL, Sockets, templates, FastCGI and Apache module.

 

性能优化

我们在使用Apache作为web服务器的过程中,只有对Apache服务器进行适当的优化配置,才能让Apache发挥出更好的性能;再反过来说,如果Apache的配置非常糟糕,Apache可能无法正常为我们服务。因此,针对我们的应用需求对Apache服务器的配置进行一定的优化是必不可少的。

硬件和操作系统

毫无疑问,要想让Apache服务器发挥出更好的性能,首先必须得保证硬件和操作系统能够满足Apache服务器的负载需要。如果由于硬件和操作系统原因导致Apache的运行性能受到较大的影响,即使对Apache服务器本身优化配置得再好也无济于事,「想要马儿跑得好,又想马儿不吃草」当然是行不通的。

一般而言,影响web服务器性能的最大的因素是内存。当内存不足时,操作系统将会使用内存交换机制。内存交换机制,简而言之,就是将本地磁盘的一部分作为虚拟内存空间供程序使用。web服务器想要更好地所有用户服务,则其应该永远不要使用内存交换机制,否则其性能将会受到较大的影响。不仅如此,由于服务器使用了内存交换机制所产生的「滞后」,「滞后」的直接后果就是让用户感觉网站的访问速度很慢,此时用户极有可能会点击【停止】或者【刷新】,如果用户不停地点击【刷新】,将会给服务器带来更大的负载,从而进入一个恶性循环。

对于Apache服务器的内存需求量,我们可以通过操作系统相关命令查看服务器正常运行时每个为用户服务的进程(或线程)平均占用多少的内存,再根据需求或者相关数据得出单个服务器所要支撑的最大并发负载数,从而计算出Apache服务器的内存需求量。为Apache服务器分配的内存最好能够大于计算得来的需求量。

除此之外,硬件最好能够保证有足够快的CPU、足够快的网卡(足够的带宽)、足够快足够大的硬盘。这里的「足够」是指能够满足web应用的实际需求。

至于操作系统,最好能够选择一个有利于服务器运行的最新最稳定的版本并安装好了对应的补丁程序。毕竟,随着时代的发展,操作系统也在不断进步。许多操作系统厂商都提供了可以显著改善性能的TCP协议栈和线程库。例如,如果你的操作系统支持sendfile()系统调用,Apache 2.x服务器可以使用sendfile()从而更快地发送静态内容并且占用较少的CPU时间。

优化Apache配置

1.尽量使用IP地址代替域名

在Apache的配置文件中,有许多可以针对具体请求来源进行相应操作的配置,例如 allow from 365mini.com表示允许域名为365mini.com的用户访问。在这种情况下,如果我们知道该域名或主机名与某个IP地址一一对应,则最好使用具体的IP地址来代替域名。否则Apache服务器将要进行多次DNS查询来确定该域名或主机名所对应的IP地址。

注意:可能存在一些例外情况,例如一个IP地址对应多个域名,或者一个域名对应多个IP地址或者对应一个变化的IP地址,此时仍然要使用域名或主机名。一般而言,只有域名或主机名与IP地址具有一一对应关系时,才使用IP地址来代替域名。请根据实际情况作出选择。

2.启用FollowSymLinks选项

当Apache处理请求时,如果对应的请求文件所在目录没有启用FollowSymLinks选项,或使用了SymLinksIfOwnerMatch选项,Apache就必须执行额外的系统调用来验证符号连接的安全性。文件名的每一个组成部分都需要一次额外的调用。因此,如果在安全性允许的情况下,为了得到更加良好的运行性能,应当放弃对符号连接的保护,在所有地方都设置FollowSymLinks,并放弃使用SymLinksIfOwnerMatch。

#启用FollowSymLinks选项,如果子目录没有额外的设置,将会继承该设置

Options FollowSymLinks

3.禁用AllowOverride

如果Apache的配置文件中允许了AllowOverride指令,则Apache在处理每个请求路径时,都会尝试对文件路径的每一个组成部分都打开该目录下的.htaccess文件。

例如,当用户请求访问服务器上的/static/test/hello.html,则Apache将会尝试打开/static/test/.htaccess、/static/.htaccess、/.htaccess三个文件。从而影响服务器的运行性能。

因此,如果当前用户拥有Apache配置文件的编辑权限,建议将.htaccess文件中的配置内容直接写在Apache对应的配置文件(一般为httpd.conf)中,并禁用AllowOverride。

#禁用AllowOverride

AllowOverride None

当然,如果用户不具备Apache配置文件的编辑权限,又希望能够对站点进行相应的管理设置,就需要管理员允许AllowOverride,以便于用户编写自己的.htaccess文件。

4.尽量不使用通配符

在Apache的配置文件中,我们可以指定每个目录下的默认欢迎页面,例如:

#以内容协商的方式指定欢迎页面

DirectoryIndex index

使用上述配置后,当访问当前目录时,Apache将会在当前目录下查找名称形如index.*的文件,并根据客户端期望响应的类型自动返回一个最匹配的请求文件(即内容协商)。

不过,这样做将会导致一点性能损失,尽管内容协商的好处大于性能的损失,如果你仍然在意这一点性能损失的话,建议你不要使用上述通配符形式的配置,而是根据自己的需要,指定一个完整的index.*文件列表。

#指定欢迎页面

DirectoryIndex index.html index.cgi index.pl

使用上述配置后,Apache将按照从左到右的先后顺序依次查找上述三个名称的文件,并响应最先找到的那个文件。

5.选择适当的多路处理模块(MPM)

由于多路处理模块的相关内容较多,请参考下面的修改最大并发连接数

6.修改Apache的并发连接配置

关于修改Apache的并发连接配置的具体内容,请同样参考请参考下面的修改最大并发连接数

并发连接数

Apache是一个跨平台的web服务器,由于其简单高效、稳定安全的特性,被广泛应用于计算机技术的各个领域。现在,Apache凭借其庞大的用户数,已成为用户数排名第一的web服务器。

尽管如此,在实际的生产环境中,我们仍然不可能直接使用默认配置的Apache来充当服务器。毕竟,为了更充分合理地利用Apache服务器,我们都应该根据自己的实际需要对Apache的默认配置作出一些必要的调整。而针对Apache的优化配置过程中,修改Apache的最大并发连接数 [3]  就显得尤为重要。

在修改Apache的最大并发连接数 [3]  之前,我们需要预先了解一些Apache的相关知识。

众所周知,Apache是一个跨平台的、采用模块化设计的服务器。为了应对不同的平台和不同的环境产生的各种不同的需求,也为了在具体的平台或环境下达到最佳的效果,Apache在web服务器的基础功能方面(端口绑定、接收请求等)也同样采用了模块化设计,这个Apache的核心模块就叫做多路处理模块(Multi-ProcessingModule,简称MPM)。

Apache针对不同的操作系统提供了多个不同的MPM模块,例如:mpm_beos、mpm_event、mpm_netware、mpmt_os2、mpm_prefork、mpm_winnt、mpm_worker。如果条件允许,我们可以根据实际需求将指定的MPM模块编译进我们自己的Apache中(Apache的源码是开放的,允许用户自行编译)。不过,如果在编译时我们没有选择,Apache将按照如下表格根据不同的操作系统自行选择对应的MPM模块,这也是Apache针对不同平台推荐使用的MPM模块。

不同操作系统上默认的MPM模块

操作系统

MPM模块

描述

Windows

mpm_winnt

不用介绍了吧:)

Unix/Linux

mpm_prefork

不用介绍了吧:)

BeOS

mpm_beos

由Be公司开发的一种多媒体操作系统,官方版已停止更新。

Netware

mpm_netware

由NOVELL公司推出的一种网络操作系统

OS/2

mpmt_os2

一种最初由微软和IBM共同开发的操作系统,现由IBM单独开发(微软放弃OS/2,转而开发Windows)

mpm_event模块可以看作是mpm_worker模块的一个变种,不过其具有实验性质,一般不推荐使用。

当然,Apache在其官方网站上也提供了根据不同操作系统已经编译好对应MPM模块的成品Apache。你可以点击此处进入Apache官方网站下载。

此外,如果我们想要知道某个Apache内部使用的是何种MPM模块,我们可以以命令行的方式进入Apache安装目录\bin,然后键入命令httpd-l,即可查看到当前Apache内部使用的何种MPM模块。

使用httpd-l命令查看编译模块

由于在平常的开发工作中,BeOS、NetWare、OS/2等操作系统并不常见,这里我们主要针对Windows和Unix/Linux操作系统上的MPM模块进行讲解。在Windows和Unix/Linux操作系统上,MPM模块主要有mpm_winnt、mpm_prefork、mpm_worker三种。

mpm_prefork模块

mpm_prefork模块主要应用于Unix/Linux平台的Apache服务器,其主要工作方式是:当Apache服务器启动后,mpm_prefork模块会预先创建多个子进程(默认为5个),当接收到客户端的请求后,mpm_prefork模块再将请求转交给子进程处理,并且每个子进程同时只能用于处理单个请求。如果当前的请求数将超过预先创建的子进程数时,mpm_prefork模块就会创建新的子进程来处理额外的请求。Apache总是试图保持一些备用的或者是空闲的子进程用于迎接即将到来的请求。这样客户端的请求就不需要在接收后等候子进程的产生。

由于在mpm_prefork模块中,每个请求对应一个子进程,因此其占用的系统资源相对其他两种模块而言较多。不过mpm_prefork模块的优点在于它的每个子进程都会独立处理对应的单个请求,这样,如果其中一个请求出现问题就不会影响到其他请求。同时,mpm_prefork模块可以应用于不具备线程安全的第三方模块(比如PHP的非线程安全版本),且在不支持线程调试的平台上易于调试。此外,mpm_prefork模块还具有比mpm_prefork模块更高的稳定性。

mpm_worker模块

mpm_worker模块也主要应用于Unix/Linux平台的Apache服务器,它可以看作是mpm_prefork模块的改进版。mpm_worker模块的工作方式与mpm_prefork模块类似。不过,由于处理相同请求的情况下,基于进程(例如mpm_prefork)比基于线程的处理方式占用的系统资源要多。因此,与mpm_prefork模块不同的是,mpm_worker模块会让每个子进程创建固定数量的服务线程和一个监听线程,并让每个服务线程来处理客户端的请求,监听线程用于监听接入请求并将其传递给服务线程处理和应答。Apache总是试图维持一个备用或是空闲的服务线程池。这样,客户端无须等待新线程或新进程的建立即可得到处理。

与mpm_prefork模块相比,mpm_worker模块可以进一步减少系统资源的开销。再加上它也使用了多进程,每个进程又有多个线程,因此它与完全基于线程的处理方式相比,又增加了一定的稳定性。

mpm_winnt模块

mpm_winnt模块是专门针对Windows操作系统而优化设计的MPM模块。它只创建一个单独的子进程,并在这个子进程中轮流产生多个线程来处理请求。

修改MPM模块配置

在对Apache的MPM模块具备一定了解后,我们就可以针对不同的MPM模块来修改Apache的最大并发连接数 [3]  配置了。

1、启用MPM模块配置文件

在Apace安装目录/conf/extra目录中有一个名为httpd-mpm.conf的配置文件。该文件主要用于进行MPM模块的相关配置。不过,在默认情况下,Apache的MPM模块配置文件并没有启用。因此,我们需要在httpd.conf文件中启用该配置文件,如下所示:

1

2

3

4

#Server-poolmanagement(MPMspecific)

 

 

Includeconf/extra/httpd-mpm.conf(去掉该行前面的注释符号"#")

2、 修改MPM模块配置文件中的相关配置

在启动MPM模块配置文件后,我们就可以使用文本编辑器打开该配置文件,我们可以看到,在该配置文件中有许多配置节点,只有Apache使用对应MPM模块时,对应配置才会生效

此时,我们就需要根据当前Apache服务器所使用的MPM模块,来修改对应节点下的参数配置。首先,我们来看看mpm_winnt模块下的默认配置:

1

2

3

4

5

6

7

8

#由于mpm_winnt模块只会创建1个子进程,因此这里对单个子进程的参数设置就相当于对整个Apache的参数设置<IfModulempm_winnt_module>

 

 

ThreadsPerChild150#推荐设置:小型网站=1000中型网站=1000~2000大型网站=2000~3500

MaxRequestsPerChild0#推荐设置:小=10000中或大=20000~100000

 

 

IfModule>

对应的配置参数作用如下:

参数名称

参数作用

ThreadsPerChild

每个子进程的最大并发线程数。

MaxRequestsPerChild

每个子进程允许处理的请求总数。

(如果累计处理的请求数超过该值,该子进程将会结束(然后根据需要确定是否创建新的子进程),该值设为0表示不限制请求总数(子进程永不结束)。该参数建议设为非零的值,可以带来以下两个好处:

1.可以防止程序中可能存在的内存泄漏无限进行下去,从而耗尽内存。

2.给进程一个有限寿命,从而有助于当服务器负载减轻的时候减少活动进程的数量。

)

注意:在以上涉及到统计请求数量的参数中,对于KeepAlive的连接,只有第一个请求会被计数。

接着,我们再来看看mpm_perfork模块和mpm_worker模块下的默认配置:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

#mpm_perfork模块

 

 

<IfModulempm_prefork_module>

 

 

StartServers5#推荐设置:小=默认中=20~50大=50~100

 

 

MinSpareServers5#推荐设置:与StartServers保持一致

 

 

MaxSpareServers10#推荐设置:小=20中=30~80大=80~120

 

 

MaxClients150#推荐设置:小=500中=500~1500大型=1500~3000

 

MaxRequestsPerChild0#推荐设置:小=10000中或大=10000~500000

 

(此外,还需额外设置ServerLimit参数,该参数最好与MaxClients的值保持一致。)

 

IfModule>

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

#mpm_worker模块

 

<IfModulempm_worker_module>

 

StartServers2#推荐设置:小=默认中=3~5大=5~10

 

MaxClients150#推荐设置:小=500中=500~1500大型=1500~3000

 

MinSpareThreads25#推荐设置:小=默认中=50~100大=100~200

 

MaxSpareThreads75#推荐设置:小=默认中=80~160大=200~400

 

ThreadsPerChild25#推荐设置:小=默认中=50~100大型=100~200

 

MaxRequestsPerChild0#推荐设置:小=10000中或大=10000~50000

 

(此外,如果MaxClients/ThreadsPerChild大于16,还需额外设置ServerLimit参数,ServerLimit必须大于等于MaxClients/ThreadsPerChild的值。)

 

IfModule>

对应的配置参数作用如下表:

参数名称

参数作用

StartServers

启动Apache时创建的子进程数。

MinSpareServers

处于空闲状态的最小子进程数。(所谓空闲子进程是指没有正在处理请求的子进程。如果当前空闲子进程数少于MinSpareServers,那么Apache将以最大每秒一个的速度产生新的子进程。只有在非常繁忙机器上才需要调整这个参数。此值不宜过大。)

MaxSpareServers

处于空闲状态的最大子进程数。(只有在非常繁忙机器上才需要调整这个参数。此值不宜过大。如果你将该指令的值设置为比MinSpareServers小,Apache将会自动将其修改成MinSpareServers+1。)

MaxClients

允许同时连接的最大请求数量。

1、任何超过MaxClients限制的请求都将进入等待队列,直到达到ListenBacklog指令限制的最大值为止

2、对于非线程型的MPM(也就是mpm_prefork),MaxClients表示可以用于处理客户端请求的最大子进程数量,默认值是256。要增大这个值,你必须同时增大ServerLimit。

3、对于线程型或者混合型的MPM(也就是mpm_beos或mpm_worker),MaxClients表示可以用于处理客户端请求的最大线程数量。线程型的mpm_beos的默认值是50。对于混合型的MPM默认值是16(ServerLimit)乘以25(ThreadsPerChild)的结果。因此要将MaxClients增加到超过16个进程才能提供的时候,你必须同时增加ServerLimit的值。

MinSpareThreads

处于空闲状态的最小线程数。

(注:不同的MPM对这个指令的处理是不一样的:mpm_worker的默认值是75。这个MPM将基于整个服务器监视空闲线程数。如果服务器中总的空闲线程数太少,子进程将产生新的空闲线程。mpm_netware的默认值是10。既然这个MPM只运行单独一个子进程,此MPM当然亦基于整个服务器监视空闲线程数。mpm_beos和mpmt_os2的工作方式与mpm_netware差不多,mpm_beos的默认值是1;mpmt_os2的默认值是5。)

MaxSpareThreads

处于空闲状态的最大线程数。

(注:不同的MPM对这个指令的处理是不一样的:mpm_worker的默认值是250。这个MPM将基于整个服务器监视空闲线程数。如果服务器中总的空闲线程数太多,子进程将杀死多余的空闲线程。mpm_netware的默认值是100。既然这个MPM只运行单独一个子进程,此MPM当然亦基于整个服务器监视空闲线程数。mpm_beos和mpmt_os2的工作方式与mpm_netware差不多,mpm_beos的默认值是50;mpmt_os2的默认值是10。)

备注:ServerLimit表示Apache允许创建的最大进程数。值得注意的是,Apache在编译时内部有一个硬限制ServerLimit20000(对于mpm_prefork模块为ServerLimit200000)。你不能超越这个限制。

使用这个指令时要特别当心。如果将ServerLimit设置成一个高出实际需要许多的值,将会有过多的共享内存被分配。如果将ServerLimit和MaxClients设置成超过系统的处理能力,Apache可能无法启动,或者系统将变得不稳定。

注意:在配置相关参数时,请先保证服务器具备足够的硬件性能(例如:CPU、内存等)。如果发现自启动后,随着服务器的运行时间增加,服务器的内存占用也随之增加,可能是程序中出现内存泄露,请向下调整参数MaxRequestsPerChild的值以降低内存泄露带来的影响,然后尽快找出程序中的问题之所在。

 

 

 

你可能感兴趣的:(程序人生进阶之路,服务器,Apache)