Web网站服务

一、Apache网站服务基础

1.Apache简介

1)Apache的起源

1.“Apache HTTP Server”开源软件项目杰出代表,使用标准HTTP网络协议提供网页浏览服务,可运行在多种操作系统平台中;使用标准C/S架构

 

2.Apache是针对之前出现的若干个Web服务器程序进行整合、完善后形成的软件,其名源于“A Patchy Server”,意为“基于原有Web服务程序的代码进行修改(补丁)后形成的服务器程序”

 

3.1995发布1.0版本,后有“Apache Group”负责该项目的管理和维护;1999年在“Apache Group”基础成立Apache软件基金会(Apache Software Foundation,ASF)

 

4.“Apache HTTP Server”为ASF旗下著名软件项目之一,正式名称为“httpd”

2)Apache的主要特点

1.开放源代码:任何人都可自由使用,充分体现开源软件精神

2.跨平台应用:可运行在绝大多数软硬件平台,这得益于Apache的源代码开放

3.支持各种Web编程语言:可支持Perl、PHP、Python、Java、ASP等

4.模块化设计:将Apache功能分为各种模块,需要什么功能直接加载对应模块;并且支持商业自行开发模块

5.运行稳定:可用于构建具有大负载访问量的Web站点

6.良好的安全性:维护团队及时对已发现漏洞提供修补程序

3)Apache的主要版本

1.X:最高1.3,该版本继承Apache服务器1.0版本以来的优秀特性和配置管理风格,具有良好兼容、稳定性;目前已停止维护

 

2.X:Apache加入许多新的功能,新的配置语法和管理风格

 

4)httpd错误码

100(继续) - 请求者应当继续提出请求。服务器返回此代码表示已收到请求的第一部分,正在等待其余部分

 

101(切换协议) - 请求者已要求服务器切换协议,服务器已确认并准备切换

 

200(成功) - 服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。如果是对您的 robots.txt 文件显示此状态码,则表示 Googlebot 已成功检索到该文件

 

201(已创建) - 请求成功并且服务器创建了新的资源

 

202(已接受) - 服务器已接受请求,但尚未处理

 

203(非授权信息) - 服务器已成功处理了请求,但返回的信息可能来自另一来源

 

204(无内容) - 服务器成功处理了请求,但没有返回任何内容

 

205(重置内容) - 服务器成功处理了请求,但没有返回任何内容。与 204 响应不同,此响应要求请求者重置文档视图(例如,清除表单内容以输入新内容)

 

206(部分内容) - 服务器成功处理了部分 GET 请求

 

300(多种选择) - 针对请求,服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择

 

301(永久移动) - 请求的网页已永久移动到新位置。服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。您应使用此代码告诉 Googlebot 某个网页或网站已永久移动到新位置

 

302(临时移动) - 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求 的 301 代码类似,会自动将请求者转到不同的位置,但您不应使用此代码来告诉 Googlebot 某个网页或网站已经移动,因 为 Googlebot 会继续抓取原有位置并编制索引

 

303(查看其他位置) - 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。对于除 HEAD 之外的所有请求,服务器会自动转到其他位置

 

304(未修改) - 自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网页内容;如果网页自请求者上次请求后再也没有更改过,您应将服务器配置为返回此响应(称为 If-Modified-Since HTTP 标头)。服务器可以告诉搜索引擎的蜘蛛/机器人 自从上次抓取后网页没有变更,进而节省带宽和开销


305(使用代理) - 请求者只能使用代理访问请求的网页。如果服务器返回此响应,还表示请求者应使用代理

 

307(临时重定向) - 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来响应以后的请求。此代码与响应 GET 和 HEAD 请求 的 301 代码类似,会自动将请求者转到不同的位置,但您不应使用此代码来告诉 Googlebot 某个页面或网站已经移动,因 为 Googlebot 会继续抓取原有位置并编制索引

 

400(错误请求) - 服务器不理解请求的语法

 

401(未授权) - 请求要求身份验证。对于登录后请求的网页,服务器可能返回此响应

 

403(禁止) - 服务器拒绝请求。如果您在 Googlebot 尝试抓取您网站上的有效网页时看到此状态码(您可以在 Google 网站管理员工具诊断下的网络抓取页面上看到此信息),可能是您的服务器或主机拒绝了 Googlebot 访问

 

404(未找到) - 服务器找不到请求的网页。例如,对于服务器上不存在的网页经常会返回此代码;如果您的网站上没有 robots.txt 文件,而您在 Google 网站管理员工具"诊断"标签的 robots.txt 页上看到此状态码, 则这是正确的状态码。但是,如果您有 robots.txt 文件而又看到此状态码,则说明您的 robots.txt 文件可能命名错误或位于错误的位 置(该文件应当位于顶级域,名为 robots.txt);如果对于 Googlebot 抓取的网址看到此状态码(在"诊断"标签的 HTTP 错误页面上),则表示 Googlebot 跟随的可能是另一个页面的无效链接(是旧链接或输入有误的链接)

 

405(方法禁用) - 禁用请求中指定的方法

 

406(不接受) - 无法使用请求的内容特性响应请求的网页

 

407(需要代理授权) - 此状态码与 401(未授权)类似,但指定请求者应当授权使用代理。如果服务器返回此响应,还表示请求者应当使用代理

 

408(请求超时) - 服务器等候请求时发生超时

 

409(冲突) - 服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。服务器在响应与前一个请求相冲突的 PUT 请求时可能会返回此代码,以及两个请求的差异列表

 

410(已删除) - 如果请求的资源已永久删除,服务器就会返回此响应。该代码与 404(未找到)代码类似,但在资源以前存在而现在不存在的情况下,有时会用来替代 404 代码。如果资源已永久移动,您应使用 301 指定资源的新位置

 

411(需要有效长度) - 服务器不接受不含有效内容长度标头字段的请求

 

412(未满足前提条件) - 服务器未满足请求者在请求中设置的其中一个前提条件

 

413(请求实体过大) - 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力

 

414(请求的 URI 过长) - 请求的 URI(通常为网址)过长,服务器无法处理

 

415(不支持的媒体类型) - 请求的格式不受请求页面的支持

 

416(请求范围不符合要求) - 如果页面无法提供请求的范围,则服务器会返回此状态码

 

417(未满足期望值) - 服务器未满足"期望"请求标头字段的要求

 

500(服务器内部错误) - 服务器遇到错误,无法完成请求

 

501(尚未实施) - 服务器不具备完成请求的功能。例如,服务器无法识别请求方法时可能会返回此代码

 

502(错误网关) - 服务器作为网关或代理,从上游服务器收到无效响应

 

503(服务不可用) - 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态

 

504(网关超时) - 服务器作为网关或代理,但是没有及时从上游服务器收到请求

 

505(HTTP 版本不受支持) - 服务器不支持请求中所用的 HTTP 协议版本

2.安装httpd服务器

1)准备工作

rpm -e httpd --nodeps

/卸载使用RPM方式安装的httpd

 

vim /etc/sysconfig/network-scripts/ifcfg-eth0    /配置网络地址

DEVICE=eth0

TYPE=Ethernet

ONBOOT=yes

NM_CONTROLLED=no

BOOTPROTO=static

IPADDR=192.168.1.10

NETMASK=255.255.255.0

GATEWAY=192.168.1.1

DNS1=192.168.1.1

 

 

vim /etc/sysconfig/network   /修改主机名

NETWORKING=yes

HOSTNAME=www.xueluo.org

2)源码编译及安装

a.解包

tar -zxvf /root/httpd-2.2.17.tar.gz -C /usr/src/

 

cd /usr/src/httpd-2.2.17/

 

b.配置

./configure --prefix=/usr/local/httpd --enable-so --enable-rewrite --enable-charset-lite --enable-cgi

解:

--prefix:指定程序安装目录

--enable-so:启动动态加载模块支持,使其具有扩展能力;是用来提供DSO支持的核心模块

--enable-rewrite:启动网页地址重写功能,用于网站优化及目录迁移维护

--enable-charset-lite:启用字符集支持,以支持使用各种字符集编码的网页

--enable-cgi:启用CGI脚本程序支持,扩展网站的应用访问能力;通常执行CGI会涉及到安全问题,系统的任何都可以调用,所以,一般会把CGI放在一个特定的目录下执行

 

c.编译及安装            make && make install

 

3)确认安装结果

ls /usr/local/httpd

解:

服务目录:/usr/local/httpd/

主配置文件:/usr/local/httpd/conf/httpd.conf

网页目录:/usr/local/httpd/htdocs/

服务脚本:/usr/local/httpd/bin/apachectl

执行程序:/usr/local/httpd/bin/httpd

访问日志: /usr/local/httpd/logs/access_log

错误日志: /usr/local/httpd/logs/error_log

 

4)优化执行路径(添加到搜索路径中,方便用户使用)

ln -s /usr/local/httpd/bin/* /usr/local/bin/      /添加到PATH搜索路径中,用户不需完整命令路径即可使用           

 

5)添加httpd为系统服务(可通过chkconfig工具控制开机自启)

cp /usr/local/httpd/bin/apachectl /etc/init.d/httpd           /拷贝默认脚本文件到系统控制目录

 

vim /etc/init.d/httpd

#!/bin/bash

# chkconfig:35 82 21                  /服务识别参数,指定3、5级别顺序启动标识号

# description:Startup script for the Apache HTTP Server

/文件开头添加chkconfig识别配置,不添加chkconfig添加服务时报错

 

chkconfig --add httpd      /将httpd添加为系统服务     

chkconfig --list httpd        /查看httpd服务的自启动状态

 

二、httpd服务器的基本配置

1.Web站点的部署过程

1)确定网站名称、IP地址

需申请合法公网IP地址,并向DNS提供商申请域名,做对应主机的DNS解析记录

公司内部使用可自行配置,无需公网IP,但如需内部使用域名可搭建DNS并对对应解析记录添加,修改/etc/hosts文件提高本地解析速度

2)配置并启动httpd服务

a.配置httpd服务

vim /usr/local/httpd/conf/httpd.conf         /编辑httpd主配置文件

ServerName www.xueluo.com:80

/寻找该行(97行) ,设置网站名称

 

apachectl -t          /检测httpd.conf文件是否有语法错误;“Syntax OK”则无误

 

b.启动httpd服务                /etc/init.d/httpd start

 

netstat -utpln | grep httpd

 

3)部署网页文档

编译安装的httpd服务,网站根目录为/usr/local/httpd/htdocs目录下,将网页文档复制到此目录即可;默认提供index.html测试网页

4)在客户机中访问Web站点

 

5)查看Web站点的访问情况

访问日志: /usr/local/httpd/log/access_log

错误日志: /usr/local/httpd/log/error_log

tail -f /usr/local/httpd/logs/access_log

 

tail -f /usr/local/httpd/logs/error_log

 

2.httpd.conf配置文件

1)全局配置项

“关键值” “值”配置格式

ServerRoot:服务目录

ServerAdmin:管理员邮箱

User:运行服务的用户身份;默认daemon

Group:运行服务的组身份;默认daemon

ServerName:网站服务器的域名

DocumentRoot:网页文档的根目录

Listen:监听的IP地址、端口号;默认80端口

PidFile:保存httpd进程PID号的文件

DirectoryIndex:默认的索引页文件;默认首页文件index.html

ErrorLog:错误日志文件的位置

CustomLog:访问日志文件的位置;默认类型common

LogLevel:记录日志的级别,默认为warn(警告)

Timeout:网络连接超时,默认为300秒

KeepAlive:是否保持连接,可选On或Off

MaxKeepAliveRequests:每次连接最多请求文件数

KeepAliveTimeout:保持连接状态时的超时时间

Include:需要包含进来的其他配置文件

2)区域配置项

<Directory />                                        限制根目录的访问权限

    Options FollowSymLinks          控制选项,允许使用符号链接;访问到符号连接时,是否跳转到对应的连接路径

    AllowOverride None                            不允许隐含控制文件中的覆盖配置;是否去找.htaccess文件作为配置文件

    Order deny,allow                        访问控制策略的应用顺序;先检查禁止设定,没有禁止的全部允许

    Deny from all                               禁止任何人访问此区域

</Directory>

 

三、网站访问情况统计

1.部署AWStats分析系统

1)安装awstats软件包

 

tar -zxvf awstats-7.3.tar.gz       /解压缩

mv awstats-7.3 /usr/local/awstats                   /移动解压缩目录;该软件为绿色版直接可用

 

2)为要统计的站点建立配置文件

cd /usr/local/awstats/tools/                           /进入工具目录

 

chmod +x awstats_configure.pl                     /给予配置脚本执行权限

 

./awstats_configure.pl            /执行配置脚本

 

a.指定httpd主配置文件路径

 

b.设置日志类型        需将httpd服务器的日志记录格式为“combined”(默认为common)

 

c.为指定Web站点创建配置文件

d.后续配置工作

 

接下来会自动重启httpd服务(前提/etc/init.d/httpd脚本存在)

如若还需统计其它站点,再次运行./awstats_configure.pl

3)修改站点统计配置文件

vim /etc/awstats/awstats.www.xueluo.org.conf

 

LogFile="/usr/local/httpd/logs/access_log"

DirData="/var/lib/awstats"

 

mkdir /var/lib/awstats               /创建数据存放目录

 

4)执行日志分析,并设置cron计划任务

chmod +x awstats_updateall.pl                           /给予更新脚本执行权限

 

./awstats_updateall.pl now                 /立即更新awstats信息并统计到统计数据库中

 

crontab -e

*/5 * * * *  /usr/local/awstats/tools/awstats_updateall.pl now

 

/etc/init.d/crond start && chkconfig --level 35 crond on             

 

2.访问AWStats分析系统

http://192.168.1.10/awstats/awstats.pl?config=www.xueluo.org

 

vim /usr/local/httpd/htdocs/awstats.html

 

<html>

<head>

<meta http-equiv=refresh content="0;url=http://192.168.1.10/awstats

/awstats.pl?config=www.xueluo.org">

</head>

<body>

</body>

</html>

/实现自动调整网页,简化访问操作

http://192.168.1.10/awstats.html

 

posted @ 2017-09-27 15:40  王非雨  阅读(526)  评论(0编辑  收藏  举报