本系列中的故事纯属虚构,如有雷同实属巧合
小B是Q公司的安全攻城狮,为了完成任务小B开始做起了调研(欲知背景如何,且听下回分说)。
首先小B弄明白了Q公司的应用系统架构是:Client --> CDN --> SLB --> Server
。
发现在应用服务器上Nginx日志中采集的关于定位用户身份信息的IP维度数据不准确。不准确的原因是:因为在应用服务器中Nginx使用XFF
与remote_addr
字段采集客户IP,XFF字段很好被攻击者伪造,而remote_addr
字段一般采集都是直连时的IP,在经过多层代理、网关等设备时,更容易导致后端服务器获取的客户端IP不真实。
于是乎小B开始研究"Nginx如何获取客户端真实IP",下文是一些研究总结:
vim /opt/nginx/conf/nginx.conf
,服务器不作任何修改 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
vim /opt/nginx/conf/nginx.conf
,配置代理转发 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
vim /opt/nginx/conf/nginx.conf
,配置代理转发 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
此时我们的网络架构为:
# 客户端使用命令访问
10.10.10.99 - - [11/Dec/2019:09:04:42 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "-"
10.10.10.1 - - [11/Dec/2019:09:04:43 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "-"
10.10.10.98 - - [11/Dec/2019:09:04:42 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "-"
此时在Nginx_Server中无法获取客户端真实IP。
此时我们的网络架构为:
# 客户端访问时使用XFF
10.10.10.99 - - [11/Dec/2019:09:07:33 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.5"
10.10.10.1 - - [11/Dec/2019:09:07:32 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "10.10.10.5"
10.10.10.98 - - [11/Dec/2019:09:07:32 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.5"
此时在Nginx_Server中无法获取客户端真实IP。
使用realip
模块可以获取客户端真实IP,该方法也是目前使用最多最有效的方法。
查看nginx的编译参数:/opt/nginx/sbin/nginx -V
(如果是yum安装Nginx,则该模块是默认安装的,我这里是使用编译安装的)
set_real_ip_from
:表示从何处获取真实IP,只认可自己信赖的IP,可以是网段,也可以设置多个。
real_ip_header
:表示从哪个header属性中获取真实IP。
real_ip_recursive
:递归检索真实IP,如果从X-Forwarded-For中获取,则需要递归检索;如果中X-Real-IP中获取,无需递归。
vim /opt/nginx/conf/nginx.conf
,主要是在Server中新增代理服务器信息。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
检查配置文件是否正确:/opt/nginx/sbin/nginx -t
,然后重新加载配置文件:/opt/nginx/sbin/nginx -s reload
vim /opt/nginx/conf/nginx.conf
,设置代理并且设置XFF字段信息。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
vim /opt/nginx/conf/nginx.conf
,设置代理并且设置XFF字段信息。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
此时我们的网络架构为:
# 客户端使用命令访问
10.10.10.1 - - [09/Dec/2019:09:19:21 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.1, 10.10.10.98"
10.10.10.1 - - [09/Dec/2019:09:19:21 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "-"
10.10.10.98 - - [09/Dec/2019:09:19:21 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.1"
此时在Nginx_Server中remote_addr就是用户的真实IP。
此时我们的网络架构为:
# 客户端访问时使用XFF
10.10.10.1 - - [09/Dec/2019:09:20:03 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.5, 10.10.10.1, 10.10.10.98"
10.10.10.1 - - [09/Dec/2019:09:20:03 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "10.10.10.5"
10.10.10.98 - - [09/Dec/2019:09:20:03 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.5, 10.10.10.1"
此时在Nginx_Server中XFF字段依旧代表客户端的真实IP,并且伪造的IP并没有传递到Nginx_Server中。
此时我们的网络架构为:
# 客户端使用命令访问,我这里配置的是终端全局代理,所以不用单独指定代理参数
43.x.x.74 - - [09/Dec/2019:14:58:02 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "43.x.x.74, 172.16.178.76"
43.x.x.74 - - [09/Dec/2019:14:58:02 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "-"
172.16.178.76 - - [09/Dec/2019:14:58:02 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "43.x.x.74"
此时在Nginx_Server中XFF字段就是用户的代理IP,并且可以看到单独使用Nginx无法获取客户端的真实IP。
在第一层代理服务器位置,处理用户传递的XFF信息,忽略用户的XFF值。
vim /opt/nginx/conf/nginx.conf
,Nginx_Server配置不作任何修改,默认即可。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
vim /opt/nginx/conf/nginx.conf
,定义XFF为remote_addr。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
vim /opt/nginx/conf/nginx.conf
,只做代理转发。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
此时我们的网络架构为:
# 客户端使用命令访问
10.10.10.99 - - [09/Dec/2019:09:37:39 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.1"
10.10.10.1 - - [09/Dec/2019:09:37:39 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "-"
10.10.10.98 - - [09/Dec/2019:09:37:39 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.1"
此时在Nginx_Server中XFF字段就代表用户的真实IP。
此时我们的网络架构为:
# 客户端访问时使用XFF
10.10.10.99 - - [09/Dec/2019:09:41:53 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.1"
10.10.10.1 - - [09/Dec/2019:09:41:53 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "10.10.10.5"
10.10.10.98 - - [09/Dec/2019:09:41:53 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.1"
此时在Nginx_Server中XFF字段依旧代表客户端的真实IP,并且伪造的IP并没有传递到Nginx_Server中。
此时我们的网络架构为:
# 客户端使用命令访问,我这里配置的是终端全局代理,所以不用单独指定代理参数
172.16.178.77 - - [09/Dec/2019:15:07:45 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "43.x.x.74"
43.x.x.74 - - [09/Dec/2019:15:07:44 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "-"
172.16.178.76 - - [09/Dec/2019:15:07:44 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "43.x.x.74"
此时在Nginx_Server中XFF字段就是用户的代理IP,并且可以看到单独使用Nginx无法获取客户端的真实IP。
vim /opt/nginx/conf/nginx.conf
,将日志中的remote_addr替换为http_x_real_ip。 # 注意日志配置的第一个字段,将remote_addr修改为http_x_real_ip
vim /opt/nginx/conf/nginx.conf
,设置代理与x-real-ip字段。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
vim /opt/nginx/conf/nginx.conf
,只做代理转发。 log_format main '$remote_addr - $remote_user [$time_local] "$request" '
此时我们的网络架构为:
# 客户端使用命令访问
10.10.10.1 - - [09/Dec/2019:09:55:16 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "-"
10.10.10.1 - - [09/Dec/2019:09:55:16 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "-"
10.10.10.98 - - [09/Dec/2019:09:55:16 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "-"
此时在Nginx_Server中第一个字段就代表客户端的真实IP。
此时我们的网络架构为:
# 客户端访问时使用XFF
10.10.10.1 - - [09/Dec/2019:10:00:38 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.5"
10.10.10.1 - - [09/Dec/2019:10:00:38 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "10.10.10.5"
10.10.10.98 - - [09/Dec/2019:10:00:38 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "10.10.10.5"
此时在Nginx_Server中第一个字段依旧代表客户端真实IP,伪造的IP在XFF字段中。
此时我们的网络架构为:
# 客户端使用命令访问,我这里配置的是终端全局代理,所以不用单独指定代理参数
43.x.x.74 - - [09/Dec/2019:15:16:05 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "-"
43.x.x.74 - - [09/Dec/2019:15:16:05 +0800] "GET / HTTP/1.1" 200 612 "-" "curl/7.64.1" "-"
172.16.178.76 - - [09/Dec/2019:15:16:05 +0800] "GET / HTTP/1.0" 200 612 "-" "curl/7.64.1" "-"
此时在Nginx_Server中第一个字段依旧代表客户端真实IP。
阿里云 如何获取客户端真实IP(https://help.aliyun.com/document\_detail/54007.html)
使用知道创宇云安全后如何获取访客真实IP(http://help.yunaq.com/faq/67/index.html)
关于服务端获取客户端的真实IP可以实际场景实际分析吧!本文中提到的也只是一种很初级的网络架构。本文的适用范围相对也比较狭窄。
如果是复杂的网络结构,可以在每一层的产品上对对应厂商进行沟通:是否可以透传用户的真实IP,然后通过每一层的配置将真实IP传递到服务端使用合理的字段进行存储。
当然了安全本质就是不可信,传递的IP数据是否真实与客户端伪造技术、各层级之间相关配置都息息相关。IP维度也只是后端分析识别的一个维度而已,我们在尽可能保证这个维度的准确度时,不用太过钻牛角尖(除非是精准度要求非常高的场景)。对于中小型的企业,能结合IP、Location、Username、UA、Browser Banner、OS Banner等维度来做一些简单的关联分析即可。
以上就是小B做日志分析的前期调研第一篇,小B后续还会写一写关于日志分析的其他文章。(WeChat:Lzero2012)
Nginx多级反向代理下的IP透传(https://www.cnblogs.com/tea-melon/p/10977516.html)
Nginx之X-Forwarded-For中首个IP一定真实吗?(https://juejin.im/entry/5bbb6e90f265da0a89304a43)