前言
图关系型数据库已经出现很久了,也或多或少的应用在了安全领域,如:
1. 代码审计,漏洞挖掘,如:https://github.com/wh1t3p1g/tabby-path-finder/;
2. 资产关联:各个态势感知平台会用作来展示关系;
3. 漏洞信息/威胁信息等:
这些都或多或少的增强了安全的实力,图可以用更直接的方式来展示和分析各个节点之间的关系,在分析日志的时候,大家的文章考虑过分别用流量日志、主机日志来用图去分析,也讨论过去综合分析,现在来考虑,在流量/主机日志都尽可能抓到的情况下,结合图数据库,能做到什么地步。
逻辑很简单,通过文件上传,上传一个webshell,在通过webshell工具去连接、通过cs来进行后渗透,如:进程注入等其他工作等。这些东西很简单,几个虚拟机都可以完成,就不详细说明了。流量日志使用支持snort规则库的引擎来进行,主机日志是在windows上的sysmon,因为他们都有不错的检测规则,特别是sysmon,对于windows,基本上所有需要的字段都能得到(不愧是微软自己的),然而,虽然有SysmonForLinux,经过简单测试,并不理想。
先看下绿盟的文章
https://mp.weixin.qq.com/s/ofP4j2TEfNoCYqrLhMsvZA
其实给了不错的思路,通过5元组来进行配置来尽可能的将主机和网络侧的日志来进行关联。
sysmon可直接参考微软的官方教程:https://learn.microsoft.com/zh-cn/sysinternals/downloads/sysmon 里面涉及到网路连接、文件的增删、进程的注入等等,详情可根据具体情况分析。
ID
标记
事件
1
ProcessCreate
进程创建
2
FileCreateTime
文件创建时间
3
NetworkConnect
检测到网络连接
4
不适用
Sysmon 服务状态更改(无法筛选)
5
ProcessTerminate
进程已终止
6
DriverLoad
驱动程序已加载
7
ImageLoad
映像已加载
8
CreateRemoteThread
检测到 CreateRemoteThread
9
RawAccessRead
检测到 RawAccessRead
10
ProcessAccess
进程被访问
11
FileCreate
文件已创建
12
RegistryEvent
已添加或删除注册表对象
13
RegistryEvent
注册表值已设置
14
RegistryEvent
注册表对象已重命名
15
FileCreateStreamHash
文件流已创建
16
不适用
Sysmon 配置更改(无法筛选)
17
PipeEvent
已命名管道已创建
18
PipeEvent
已命名管道已连接
19
WmiEvent
WMI 筛选器
20
WmiEvent
WMI 使用者
21
WmiEvent
WMI 使用者筛选器
22
DNSQuery
DNS 查询
23
FileDelete
文件删除已存档
24
ClipboardChange
剪贴板中的新内容
25
ProcessTampering
进程映像更改
26
FileDeleteDetected
文件删除已记录
27
FileBlockExecutable
文件阻止可执行
28
FileBlockShredding
文件阻止粉碎
29
FileExecutableDetected
可执行文件已删除
流量的基础信息为五元组(源ip、目的ip、协议、源端口、目的端口)、预警信息等。
主机日志与流量日志所共用的点在于网络连接信息即四元组(源ip、目的ip、源端口、目的端口),那么我就可以通过这个来将两个日志类型关联起来。然后就是对日志事件的字段进行分析,如:
1. 网络连接:源ip->告警日志->进程->目的ip;
2. 创建文件:进程->文件;
3. 进程注入:进程->目标进程;
理论上通过自定义的规则就可以将所有的行为与进程串联起来了。
前面已经说了思路,那么我们来一步步来测试下情况,原始情况:
因为存在扫描行为,和正常请求行为,所以不可避免的造成爆炸,那么我们先去掉扫描的事件和一些不重要的请求日志:
然后具体分析下
可以看到根据流量告警关联到了httpd.exe,httpd.exe下的php-cgi.exe创建了一个cs.exe,并且执行
这是在webshell工具上执行的命令,通过主机日志可以弥补流量日志的不足,了解攻击者到底做了什么。
然后攻击者通过cs木马连接到攻击者的c2上,也可通过流量/主机日志进行关联。通过日志的综合分析,可以将攻击者的整个行为串联,在复杂情境下,对于通过免杀或者流量混淆绕过安全设备的行为也可以尽量找出踪迹,发现攻击者。
在实际过程里,很多设备的日志都是割裂开来的,流量是流量,终端是终端,导致大家进行分析溯源分析都比较割裂,无法准确的还原攻击链路,虽然edr等设备已经出来很久了,但实战上与流量设备的配合并不太理想。实验只使用了很简单很简单的场景,对于日志自定义了一些处理规则,实现了将整个攻击链路展现的情景。然而,真正情况下,会有一下问题:
1. 流量告警的数量超级多,数据清理和策略的编写是个大问题;
2. 攻击者的阶段性攻击可能并不发生在同一时间,那么日志关联的时间颗粒度也是问题;
3. 不管是流量/终端日志都会有存储不完全的情况,没有监测到行为或者被攻击者kill掉/删除,之所以使用windows实验,也是没在linux下发现类似于sysmon一样好用的日志记录工具;
4. 正如绿盟的文章说的:完全利用图分析算法进行复杂攻击识别是有天花板的,外部知识的引入是一种有效的手段,但是当前外部知识只是简单的根据规则抽象出一些已有攻击的威胁子图,利用ATT&CK相关的攻击战术手法。需要在实战不断去试验、反馈、结合算法、ai、大数据等技术去发展;
安全运营的概念提出好久,产品也更新换代了很多,攻击溯源依然是实现主动防御的一种思路,希望某一天真的可以看到有真正好用的落地产品。