史上最全的技术实践之nginx，反向代理、防盗链、高速缓存_新闻资讯

史上最全的技术实践之nginx，反向代理、防盗链、高速缓存

媒体资源网 http://www.allchina.cn 2023/6/16

今天说说Nginx，其实有老铁比较奇怪，nginx不是运维来搞的吗？确实是的，大部分情况下，公司比较大的话，存在运维的话，这个锅肯定是运维来做的。但是现在有个趋势叫devops之前我也说过，开发运维一体化，开发也要懂一定的运维知识。在一些互联网的创业公司刚开始技术的工种，并不是分的那么清楚，可能都要会的。环境的搭建，运维，框架搭建，开发都必须拿得下来。

源码：https://github.com/limingios/netFuture/tree/master/nginx

Nginx服务搭建与基础演示（一）

Nginx

官网

http://nginx.org/

介绍

Nginx是一个轻量级、高性能、稳定性高、并发性好的HTTP和反向代理服务器。也是由于其的特性，其应用非常广。

历史

由俄罗斯的程序设计师Igor Sysoev所开发，最初供俄国大型的入口网站及搜寻引擎Rambler（俄文：Рамблер）使用。其特点是占有内存少，并发能力强，事实上nginx的并发能力确实在同类型的网页伺服器中表现较好.目前中国大陆使用nginx网站用户有：新浪、网易、腾讯,另外知名的微网志Plurk也使用nginx。

理解代理的概念

1.正向代理：某些情况下，代理我们用户去访问服务器，需要用户手动的设置代理服务器的ip和端口号。

2.反向代理：是用来代理服务器的，代理我们要访问的目标服务器。代理服务器接受请求，然后将请求转发给内部网络的服务器(集群化)，并将从服务器上得到的结果返回给客户端，此时代理服务器对外就表现为一个服务器。

根据源码配置的机器

系统类型IP地址节点角色CPUMemoryHostnameCentos7192.168.66.110nginx12GnginxCentos7192.168.66.111tomcat12Gtomcat1Centos7192.168.66.112tomcat12Gtomcat2

三台机器

准备工作

yum -y install make zlib zlib-devel gcc-c libtool openssl openssl-devel

nginx主机安装pcre的安装包（192.168.66.110）

https://sourceforge.net/projects/pcre/files/pcre/

nginx rewrite依赖于PCRE库，所以需要在linux系统中编译安装PCRE库

wget https://nchc.dl.sourceforge.net/project/pcre/pcre/8.41/pcre-8.41.tar.gztar zxvf pcre-8.41.tar.gzcd image.png./configuremake && make installpcre-config --prefix

安装nginx

cd ..wget http://nginx.org/download/nginx-1.13.10.tar.gztar zxvf nginx-1.13.10.tar.gzmkdir nginxcd nginx-1.13.10./configure --prefix=/root/nginx --with-http_stub_status_module --with-http_ssl_module --with-pcre=/root/pcre-8.41make && make install cd ~cd nginx/sbin/./nginx -v./nginx -t

启动nginx

cd ~/nginx/sbin/./nginx

其实没有权限

修改配置文件

vi ~/nginx/conf/nginx.conf#修改成user root#wq保存#重新加载nginx新的配置./sbin/nginx -s reload

111 和112 两个机器安装tomcat

java -versionwget http://mirrors.hust.edu.cn/apache/tomcat/tomcat-8/v8.5.37/bin/apache-tomcat-8.5.37.tar.gz

tar zxvf apache-tomcat-8.5.37.tar.gz cd apache-tomcat-8.5.37cd bin./startup.shcurl 127.0.0.1:8080

111 和112 添加一个index.jsp文件方法查看

cd /root/apache-tomcat-8.5.37/webapps/ROOT>index.jspvi index.jspcat index.jsp

upstream 与location 模块参数与案例讲解（二）

未来软件其实都是趋于模块化的。拼装完成。

upstream

官网的介绍

http://nginx.org/en/docs/

upstream实例

http://nginx.org/en/docs/http/ngx_http_upstream_module.html

upstream 参数

参数名称描述service反向服务地址加端口weight权重max_fails失败多少次认为主机已挂掉则，踢出，默认是1次，企业一般配置2到3次，但是电商更加重视用户体验所以就是1次。前提这个机器供给比较多。fail_timeout踢出后重新探测时间backup备用服务max_conns允许最大连接数slow_start当节点恢复，不立即加入

修改66.110 那个nginx配置文件

vi /root/nginx/conf/nginx.confcat /root/nginx/conf/nginx.conf

因为权重相同，所以轮播111 和 112 2个tomcat

*负载均衡算法

1.ll weight

默认的负载算法，其实就是根据权重才分配服务请求。

2.ip_hash

基于Hash 计算应用场景：保持session 一至性，第一次访问那台，一直是同一台。hash(ip)%3 =index。弊端小区或者学校集中化的地方，他们出去的ip都是一致的，某个节点负载会非常非常的大。成为热点，有了ip_hash导致weight权重就失效了。

3.url_hash

(第三方)应用场景：静态资源缓存,节约存储，加快速度

4.least_conn

最少链接

5.least_time

最小的响应时间,计算节点平均响应时间，然后取响应最快的那个，分配更高权重。

6.keeplive

占用连接数。内存消耗比较大，但是响应速度很快，应该保持这socket连接。

location1.root

后面的配置相当于把浏览器中的输入路径进行了重指

2.index

在前后端分离的基础上，指定网站初始页

3.proxy_set_header

用来重定义发往后端服务器的请求头

4.proxy_pass

如果在proxy_pass后面的url加/，表示绝对根路径；如果没有/，表示相对路径，把匹配的路径部分也给代理走

动静分离方案

一般动静分离两种方式

静态文件放入nginx静态文件放入指定的服务器，通过请求地址来区别跳转到那个服务器。静态文件放入nginx

#思路：动、静态的文件，请求时匹配不同的目录当访问gif,jpeg时直接访问e:wwwroot;server { listen 80; server_name localhost; location / { root e:wwwroot; index index.html; } # 所有静态请求都由nginx处理，存放目录为html location ~ .(gif|jpg|jpeg|png|bmp|swf|css|js)$ { root e:wwwroot; } # 所有动态请求都转发给tomcat处理 location ~ .(jsp|do)$ { proxy_pass http://test; } error_page 500 502 503 504 /50x.html; location = /50x.html { root e:wwwroot; } } 静态服务器的方式

多个upstream，多个location， location的名称不一样。

Nginx如何实现高速缓存（三）

场景介绍

假设在做一个大型项目，面向全国的，公司对架构师的要求是做到700 的QPS，如何去处理。

介绍几个开发网站需要了解的关键字响应时间(RT)

响应时间是指系统对请求作出响应的时间。

吞吐量(TPS)

系统在单位时间内处理请求的数量

并发用户数

系统可以同时承载的正常使用系统功能的用户的数量

QPS每秒查询率

对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准

了解下一个网站一般的实际html大小

打开一个技术博客：idig8.com

查看源代码

保存在文件大小：45kb，700QPS/s = 700*45/1024 = 30MB，单个页面如果700QPS的话需要吐出来30MB/s的量，毕竟是个人博客肯定承受不了。

image.png

咱们在拿某东为例，保存在文件大小：186kb，700QPS/s = 700*186/1024 = 100MB ，单个页面如果700QPS的话需要吐出来100MB/s的量，某东好牛逼。

如果让咱们来设计京东这么大的体谅如何设计。

对于商品详情页涉及了如下主要服务:商品详情页HTML页面渲染价格服务促销服务库存状态/配送至服务广告词服务预售/秒杀服务评价服务试用服务推荐服务商品介绍服务各品类相关的一些特殊服务

上边的全部搞成微服务。

采用Ajax 动态加载价格、广告、库存等服务采用key value 缓存详情页主体html。

很多比较大型的内部系统都是这样来设计的。

微服务和微服务之前都是内网都是千兆带宽，第一次从微服务中取。之后都是通过redis直接过去。特殊的数据通过ajax的方式。从redis来获取肯定会有大大的提升。如果用这种情况500qps还是可以的，如果想往上走，基本很难得。但是我们的要求走到700qps。

当达到500QPS 的时候很难继续压测上去。

分析原因:一个详情页html 主体达平均150 kb 那么在500QPS 已接近局域网宽带极限。75MB ，内网一般都是千兆带宽，千年带宽128MB/s，其实这个也是在往内网IO的一个瓶颈上边走。在上边图的架构，其实内网走了2次，一个是通过nginx访问商品的详情服务，一个是详情服务访问redis。

如果想解决上边的2次内网的通信最理想的方式，上图中的2个节点都不要就可以了。

不走redis缓存，也不通过nginx来请求商品详情页服务，直接从nginx本地的硬盘缓存来走。内网通信的瓶颈是不是就解决了。

解决方式

减少内网的通信，nginx本身也可以通过配置将数据缓存到本地硬盘上，下次请求直接请求nginx内部的硬盘缓存数据，这样也减少了内网的通信。

正常情况下是这样的流程，有缓存的情况。

正常情况下没有缓存的情况，nginx自动添加缓存

商品变更怎么办，思路是通过MQ消息服务，通过详情页服务，由详情页服务统一的来请求直接的地址的，来清空nginx下的缓存。

nginx的缓存配置

nginx如何配置缓存

proxy_cache 是用于 proxy 模式（一般也可称为反代）的缓存功能

events { worker_connections 1024;}http { include mime.types; default_type application/octet-stream; sendfile on; keepalive_timeout 65;#配置缓存 proxy_cache_path /data/nginx/cache_item levels=1:2 keys_zone=cache_item:200m inactive=30d max_size=10g; upstream idig8 { server 192.168.66.111:8080 weight=5; server 192.168.66.112:8080 weight=5; } server { listen 80; server_name localhost; location / { root html; index index.html index.htm; } error_page 500 502 503 504 /50x.html; location = /50x.html { root html; } #配置缓存 location ~*.(html|htm)$ { proxy_set_header Host $host; proxy_set_header X-Forwarded-For $remote_addr; proxy_pass http://idig8; proxy_cache cache_item; proxy_cache_key $host$uri$is_args$args; proxy_cache_valid 200 304 12h; expires 7d; } }}

image.png

在tomcat目录下新建立一个index.html

tomcat1

idig8.com192.168.66.111

tomcat2

idig8.com192.168.66.112

重启nginx

./sbin/nginx -s stopmkdir -p /data/nginx/cache_item./sbin/nginx查看缓存路径

pwdcd /data/nginx/cache_item/3/cfls

清空缓存

看看效果

修改了index.html

请求还是缓存里面的数据

回顾如何配置，该方案Nginx 配置实现

1、在http元素下添加缓存区声明。proxy_cache_path /data/nginx/cache_item levels=1:1:2 keys_zone=cache_item:500minactive=30d max_size=10g;2、为指定location 设定缓存策略。proxy_cache cache_item;proxy_cache_key $host $uri$is_args$args;#以全路径md5值做做为Keyproxy_cache_valid 200 304 12h; #对不同的HTTP状态码设置不同的缓存时间expires 7d; #总体缓存时间

演示缓存生效过程

配置声明缓存路径为location 配置缓存策略重启nginx（修改了）查看缓存目录生成

父元素名称描述httpproxy_cache_path指定缓存区的根路径levels缓存目录层级最高三层，每层1~2个字符表示。如1:1:2 表示三层。keys_zone缓存块名称及内存块大小。如cache_item:500m 。表示声明一个名为cache_item 大小为500m。超出大小后最早的数据将会被清除。inactive最长闲置时间如:10d 如果一个数据被闲置10天将会被清除max_size缓存区硬盘最大值。超出闲置数据将会被清除locationproxy_cache指定缓存区，对应keys_zone 中设置的值proxy_cache_key通过参数拼装缓存key 如：host uri is_args args 则会以全路径md5值做做为Keyproxy_cache_valid为不同的状态码设置缓存有效期

缓存的清除：

该功能可以采用第三方模块 ngx_cache_purge 实现。将ngx_cache_purge编译到到Nginx中,用来清除指定URL的缓存。

为nginx 添加 ngx_cache_purge 模块

cd ~wget http://labs.frickle.com/files/ngx_cache_purge-2.3.tar.gz#查看已安装模块~/nginx/sbin/nginx -V#进?nginx安装包?录重新安装 --add-module为模块解压的全路径cd ~/nginx-1.13.10./configure --prefix=/root/nginx --with-http_stub_status_module --with-http_ssl_module --add-module=/root/ngx_cache_purge-2.3#重新编译makecp /root/nginx-1.13.10/sbin/nginx ~/nginx/sbin/nginx #查看是否安装成功./nginx/sbin/nginx -t

清除配置

location ~ /purge(/.*) {#允许访问的IPallow 127.0.0.1;allow 192.168.0.193;#禁?访问的IPdeny all;#配置清除指定缓存区和路径(与proxy_cache_key??)proxy_cache_purge cache_item $host$1$is_args$args;}

Nginx如何防盗链（四）

提问：

什么是图片防盗链？意思是指本站内图片、CSS等资源只有本站点可以访问，不允许其它站点打开!

该功能如果用JAVA如何实现？很单简单，只要判断一下请求头当中的referer 属性是否为指定域名即可。

Nginx原理类似。

location ~* .(gif|png|jpg|swf|flv)$ {root html;valid_referers none *.tl.com;if ($invalid_referer) {rewrite ^/ http://www.tl.com/image/403.png;#return 404;}}

说明：如果 valid_referers 条件判断未通过，nginx 则会赋值 invalid_referer 为true

语法: valid_referers none | blocked | server_names | string ...;

参数说明:

none

不允许 “Referer” 来源头部为空的情况

blocked

不允许“Referer”值为空情况，有可能Referer被的值被代理或者防火墙删除

server_names

“Referer”来源头部包必须含当前的server_names （当前域名）可以多个

Nginx如何实现子域名站点配置，类似赶紧网城市站点的配置（三）

有时会有这样的需求，每个子域名对应一个静态站点（类似58到家、有赞商城等）。如果每天增加一个域名

的会相当麻烦。在nginx 当中可直接基于$host 连接到对应目录。具体配置实现如下：

server {listen 80;server_name *.tl.com;root /data/www/$host;access_log logs/$host.access.log;location / {index index.html;}}

一定要修改下，主机的host文件，它依靠host文件的。

PS：一般用nginx比较多就是反向代理，其实很多特殊的配置也是在大型互联网电商经常使用的。所以这个高速缓存和防盗链也是一个不错的功能。