【CTF入门】BUUCTF Misc刷题(持续更新)

【CTF入门】BUUCTF Misc刷题

签到(简单)

点开发现签到题直接把flag交出来了,直接复制提交即可

image-20240715095026243

考点:了解CTF中flag的格式一般为flag{}

金三胖(新工具)

下载文件,发现里面是一张gif图片,我们查看一下发现总有东西一闪而过

这里我们介绍第一个在Misc图像隐写中非常常用的工具——StegSolve

StegSolve功能一——逐帧查看gif文件

隐写图片解析神器,下载地址:http://www.caesum.com/handbook/Stegsolve.jar

它的用途有很多,之后我们会一步一步进行讲解,首先我们打开StegSolve(打不开的,参考这篇文章:详细教程:Stegsolve的下载,jdk的下载、安装以及环境的配置_stegsolve下载-CSDN博客

打开发现只有一个非常小的窗口,点击File->open导入gif图片

Analyse->Frame Browser使用帧浏览器功能分解gif的帧

image-20240715104852847

用下面的左右箭头查看各个帧的图像,我们发现了隐藏的flag:flag{he11ohongke}

image-20240715105105499image-20240715105150700image-20240715105218405

考点:利用工具逐帧查看gif文件图像

你竟然赶我走(新工具)

下载文件,发现里面是一张jpg图片,我们查看一下貌似什么也没有

biubiu

图片隐写没有具体的思路,我个人一般按照以下步骤做(来源于图书《CTF那些事儿》):

图片隐写思路:

1. 查看图片的属性是否藏了东西,一定要使用能够查看exif信息的工具,PNG格式的话使用TweakPNG等工具判断是否存在PNG宽高隐写
2. 使用010 Editor、strings等工具发现插入隐藏信息
3. 使用StegSolve、zsteg等工具发现隐写隐藏信息
4. 使用binwalk、foremost等工具提取隐藏信息
5. 使用steghide、盲水印提取等工具提取特定工具隐藏信息,如果有提示最好,没有提示只能一个个尝试了,注意jpeg和png等不同格式的图片文件使用的工具也不一样
jpeg:steghide——outguess——
png:zsteg——cloacked-pixel——BlindWaterMark-master——kindred-adds/BlindWaterMarkplus

010 Editor:十六进制编辑器

它可以把文件以十六进制的格式打开、查看、修改,下载地址:http://www.caesum.com/handbook/Stegsolve.jar(虽然还有winhex等编辑器,但个人认为010 Editor更好用一些)

首先我们打开010 Editor,导入文件

image-20240715114935725

我们看到花花绿绿一大片的东西,啥啊这是?

JPG文件格式介绍

JPG格式没有直接保存图像的像素值信息,而是将其转换为YUV色彩空间(Y表示像素的亮度,U和V一起表示色调与饱和度)保存到图像信息中,保存时既可以选择无损压缩也可以选择有损压缩。

JPG文件按照“段”的格式来组织存储,一个文件由多个段组成,每个段代表不同的信息。同时,每个段也有自己唯一的标识符。标识符由两个字节组成,格式形如0x FF XX,其中FF代表不同的类型。

例如,SOI(Start Of Image)表示图像的开始,其段的标识符为0X FF D8。更加详细请查看这篇文章:

image-20240715145051513

整个JPG图片的组织便是由这些不同类型的段和经过JPG压缩后的数据组成的。(原文来自《CTF那些事儿》)

010 Editor的模板功能

010 Editor的模板功能可以自动为我们带来文件解析后的结果(亮色标记),我们就可以更加直观地看出JPG文件的各个段的位置,我们可以通过模板存储库来检查和添加文件的模板(一般没有模板会在你导入文件的时候提醒你自动下载)

image-20240715145328682

回到题目,我们发现从头到尾文件好像都没什么问题

image-20240715145718269

我们可以ctrl+f进入字符串搜索,因为是CTF题目所以直接搜索flag,查看是否有直接插入的flag信息,果然,我们发现了:

image-20240715145937338

flag插入在文件结尾段的后边,被模板识别为“unknowPadding”段,我们直接可以复制flag提交了

考点:利用十六进制编辑器找到隐藏的信息

补充:StegSolve功能二——查看图片的具体信息

这道题我们导入StegSolve,使用查看图片的具体信息功能也可以解开

image-20240715150550531image-20240715150624105

我们用这个功能可以查看图片的具体信息,其中包括了结尾插入的隐藏Ascii(字符串)

二维码(新工具)

下载文件,发现里面是一张png格式的二维码图片,我们用二维码识别软件QR Research扫一扫,发现隐藏信息——secret is here,并没有flag

image-20240715232923685

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240715233802741

(PNG模板出了点问题,没有很明显的颜色,但不影响分析)

PNG文件格式简介

PNG是一种位图文件存储格式,既可以存储灰度图像(只有黑白灰,没有彩色),也可以存储彩色图像。PNG使用从LZ77派生的无损算法压缩图像信息,能获得较高的压缩比,并利用特殊的编码方法标记重复出现的数据,因而对图像的颜色没有影响,也不可能产生颜色的损失,这样就可以重复保存而不降低图像质量。

PNG图像格式文件由文件头和数据块(Chunk)组成。PNG图像整体格式如下:

文件头(89 50 4E 47 0D 0A 1A 0A)+数据块+数据块+数据块+......

回到题目,我们可以发现chunk[3]是PNG文件的文件尾,后面的chunk[4]块大小为0h也就是之后的内容无法被PNG模板解析了。image-20240715234026192

根据常见的文件头(记一些常用的就好)的记录我们可以发现50 4B 03 04是ZIP格式文件的文件头,也就是说这张图片后边插入了ZIP压缩包,我们应该如何把这压缩包从这张图片文件中分离出来呢?

文件分离

  1. 淳朴的复制粘贴手工艺:使用十六进制编辑器,我们把ZIP文件从文件头到文件尾的内容复制一遍,然后新建十六进制文件粘贴上去,保存后上“.zip”的后缀就有了。

    image-20240715235256241

    image-20240715235406108

    image-20240715235447401

  2. 利用Binwalk工具自动提取:Binwalk是一个自动提取文件系统,该工具可以自动完成指定文件的扫描,发现潜藏在文件中中所有可疑的文件类型以及文件系统。使用命令:

    binwalk QR_code.png -e
    

    -e 提取隐藏文件
    即可自动提取出其中的隐藏文件

    image-20240716000228758

    image-20240716000253386

  3. 利用foremost工具自动提取:foremost通过分析不同类型的头、尾和内部数据结构,同镜像文件的数据进行比对,来还原文件。支持19中类型文件的恢复。用户还可以通过配置文件扩展支持其他文件类型。使用命令:

    foremost QR_code.png -o yincang
    

    -o 输出文件名

    image-20240716000610455

    image-20240716000631669

总而言之,我们分离出了zip文件,我们尝试打开,发现里面存在一个名为“4number.txt”的文件。我们尝试解压却发现压缩包含有密码。

遇到含有密码的压缩包思路

1. 仔细注意题目是否给出压缩包解压密码的相关线索或是压缩包中有注释/备注,有的话就填或者是利用工具爆破(一般是纯数字密码)
2. 使用010 editor观察zip文件是否存在伪加密的情况
3. 需要CRC32爆破的特殊情况

根据文件名“4number”,我们可以猜测解压密码是四个数字,我们使用ARCHPR工具开始进行爆破。

ARCHPR爆破压缩包密码

爆破压缩包密码的工具,含有多种爆破模式。因为正版需要购买所以给出吾爱破解论坛大佬的破解版下载贴:Advanced Archive Password Recovery 4.54-压缩包破解工具 - 『精品软件区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn

我们打开ARCHPR,导入zip文件,攻击类型选择暴力(按照顺序一个个尝试密码),暴力范围选项选择数字,在长度那一栏最小口令和最大口令都填入4:

image-20240716002002155

image-20240716002017400

然后我们就可以开始爆破了,很快成功的消息就弹出来了:

image-20240716002057132

我们可以知道解压密码为:7639

解压文件,在“4number.txt”中得到了flag

image-20240716002217500

考点:文件分离、压缩包密码爆破

大白(新)

下载文件,发现里面是一张png格式的图片:

image-20240717102247350

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240717091524765

我们根据题目提示,优先查看PNG图片是否进行了宽高隐写

PNG宽高隐写

原理:更改了PNG图片的宽度和高度,隐藏了被截取部分图片的信息

做法:根据图片的CRC校验值更改图片的长度和宽度(CRC校验值计算原理:https://www.bilibili.com/video/BV1V4411Z7VA?vd_source=69c558b0c7be97607c79afbd75bd1f7c,理解有这个东西就行)

image-20240717093505759

因此我们首先根据图片的CRC校验值计算PNG图片正确的长度和宽度:

import binascii
import struct
crcbp = open("dabai.png", "rb").read()    #打开图片
crc32frombp = int(crcbp[29:33].hex(),16)     #读取图片中的CRC校验值
print(crc32frombp)
 
for i in range(4000):                        #宽度1-4000进行枚举
    for j in range(4000):                    #高度1-4000进行枚举
        data = crcbp[12:16] + \				#创建一个数据段,内容为从文件内容的字节12到16(包含第12字节,不包含第16字节),这部分通常是固定的。
            struct.pack('>i', i)+struct.pack('>i', j)+crcbp[24:29]				#将宽度变量'i'和高度变量'j'转换成大端格式的四字节(大端格式:字数据的高字节存储在低地址中,而字数据的低字节则存放在高地址中)
        crc32 = binascii.crc32(data) & 0xffffffff				#计算data数据段的CRC校验值,'& 0xffffffff'确保CRC校验值为32位
        print(crc32)
        if(crc32 == crc32frombp):            #计算当图片大小为i:j时的CRC校验值,与图片中的CRC比较,当相同,则图片大小已经确定
            print(i, j)
            print('hex:', hex(i), hex(j))
            exit(0)

struck.pack(format,v1,v2,...):返回一个字节对象,该对象包含根据格式字符串格式打包的值v1、v2,…。参数必须与格式要求的值完全匹配。

binascii. crc32 (data) :计算data的 32 位校验和——CRC-32

运行脚本,可以得到:

image-20240717101947775

正确的宽高应该为679x479,16进制后的值应该为00 00 02 A7和00 00 01 DF,使用010editor更改PNG图片如下:image-20240717102132225

保存文件,发现图片的高度恢复出现了新的内容,得到flag:

image-20240717102216962

考点:PNG宽高隐写、理解爆破PNG宽高原理

乌镇峰会种图(知识巩固题)

下载文件,发现里面是一张jpg格式的图片:

image-20240717102525029

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240717102638478

又一次,我们在文件尾后面发现了插入的flag:

image-20240717102730650

考点:利用十六进制编辑器找到隐藏的信息

wireshark(新工具)

下载文件,发现里面是一个pcap格式的文件。这是什么东西?

网络流量分析

网络分析工具对指定网卡进行数据包捕获,方便工作人员监测网络流量情况。

而pcap格式就是网络分析工具保存的网络数据包,是捕获的从网卡发送或者接收的每一个数据包的离线网络流量。

我们想要踏入这一部分的内容,首先我们应该熟悉网络协议的基础知识和OSI七层网络参考模型:https://www.bilibili.com/video/BV1EU4y1v7ju?vd_source=69c558b0c7be97607c79afbd75bd1f7c

我希望能够从题目入手,带大家对这方面的内容进行深入理解

回到题目,我们知道了pcap格式是网络分析工具保存的文件,那么我们应该拥有网络分析的工具。我们将重点介绍wireshark,这不仅是题目名,更是非常重要的网络分析工具。

wireshark

WireShark是非常流行的网络封包分析工具,可以截取各种网络数据包,并显示数据包详细信息。常用于开发测试过程中各种问题定位。官网下载地址:Wireshark · Download

首先我们用wireshark打开pacp文件:

image-20240717104745678

花花绿绿的一大片数据包,我们应该从何处入手?

数据包分析思路

1. 观察分组数(wireshark右下角),如果分组数量较大我们就进行协议分级进行分析,数量较小就逐个人工查看(数量小协议分级效果不明显,但还是可以优先协议分级减小工作量)
2. 根据协议分级的结果,我们优先分析数量多占比高的协议流量,分析过程根据题目不同思路也有所不同
3. 如果协议分级中有文件传输协议或是有传输媒体文件内容优先进行导出,一定要使用foremost工具进行辅助
4. 如果没有思路就搜索“flag”“ctf”等关键词
5. 涉及到攻击的流量就只能逐个追踪TCP流查看了

wireshark功能一:协议分级

对数据包按TCP/IP协议栈从底层向高层逐层进行统计,显示每个协议的数据包数、字节数以及各协议所占的百分比。

image-20240717105644790

image-20240717110357369

我们可以发现应用层HTTP协议占比最高,应该优先分析。

wireshark功能二:显示过滤器

决定哪些数据包被显示,在显示过滤器中输入表达式,使过滤规则生效。

在前面我们已经找到了需要显示过滤来分析的HTTP协议,因此我们在协议分级窗口中选中HTTP协议作为过滤器应用:

image-20240717110806356

image-20240717111219998

这样我们就显示过滤了HTTP协议相关的数据包,可以看见左上方的应用显示过滤器的输入框内容也添加了”http“,现在只有29个数据包了,我们即将开始逐个分析。

HTTP协议数据包分析

HTTP协议介绍:https://www.bilibili.com/video/BV1zb4y127JU?vd_source=69c558b0c7be97607c79afbd75bd1f7c

HTTP数据包分析:HTTP数据包详解 - dream_fly_info - 博客园 (cnblogs.com)

wireshark功能三:数据包分析

在左下角的TCP/IP协议栈解析窗口我们可以以更清晰的格式分析协议的消息结构,我们逐个分析,发现第三个POST请求包的URL加密信息里面找到了“password”字段:

image-20240717112649809

题目说管理员的密码即是答案,因此使用flag{}包起提交即可

考点:网络流量分析、理解HTTP协议数据包结构

补充:CTF流量分析解题钻空

我们明白要分析HTTP协议后,直接在显示过滤器中查找包含”flag“字段的数据包有时候能直接找到我们想要的东西:

image-20240717113113906

N种方法解决(新工具)

下载文件,发现里面是一个exe格式的文件,我们运行也运行不起:

image-20240717113506802

这又不是逆向题,给我们exe文件干嘛!所以我们优先使用010 editor分析文件:

image-20240717113626448

发现它的内容纯纯的就是一普通的文本文件,根据左上方开头的提示我们发现这些数据是源内容经历了base64编码的jpg格式的图片,因此我们使用cyberchef来进行解码:

image-20240717113824045

解码后的内容虽然是乱码,但看文件头含有“PNG”字段应该就是我们的PNG格式文件了!cyberchef有个很方便的魔法解密功能,可以直接分析出下一步应该如何解密,点击Output栏的魔法棒图标即可自动解密:

image-20240717114135101

可以发现它自动将PNG图片16进制的乱码转为了图片,出现了二维码,直接扫描解密出二维码隐藏的内容:

image-20240717114430238

考点:会使用工具解码base64、会将PNG图片的16进制的乱码转换为PNG图片

补充:

我们也可以将输出内容复制粘贴到010 editor里面创建新的16进制文件,保存为.png格式也是可以发现二维码图片的。

基础破解(知识巩固题)

下载文件,发现里面是一个rar的压缩包,根据题目提示,它是四位数字加密的。按照遇到含有密码的压缩包思路,我们直接使用工具爆破:

image-20240718151712065

解出压缩包密码为:2563,打开获得经过base64编码的flag,解码即可:

image-20240718151859293

考点:压缩包密码爆破

文件中的秘密(知识巩固题)

下载文件,发现里面是一张jpeg图片,我们查看一下貌似什么也没有

图片中的秘密

按照图片隐写思路首先查看图片属性的详细信息,在图片的备注中发现了flag:

image-20240718152543574

考点:会查看图片属性。

LSB(新)

下载文件,发现里面是一张png图片,我们查看一下貌似什么也没有

flag11

虽然题目已经明示了这是一道LSB隐写的图片,但我们还是会按照图片隐写思路做。第一步无果,我们优先打开010 editor打开图片查看:

image-20240718153114087

貌似没有插入信息,我们再用string查看:

strings flag11.png

strings 查询一个二进制文件中所含有的字符信息并将其输出来

image-20240718153947763

跑出一堆没用的乱码,我们可以开始第三步了。

StegSolve功能三——调整图片通道

LSB隐写原理:隐写术鉴赏2:11分到3:57分处

我们使用StegSolve打开图片时,下面有两个箭头,我们点击可以选择调整图片通道来观察是否有隐藏的信息。(视频中有解说,每张图片每个像素点都拥有红绿蓝三种颜色还有透明度的通道)

image-20240718155732671image-20240718155751826image-20240718155817727

我们可以发现,当我们关闭红色通道(red plane 0)、绿色通道或是蓝色通道时,图片的上方出现了黑白的印记,很显然是二进制的信息,我们继续使用StegSolve进行分析。

StegSolve功能四——数据提取

主要用于提取比特并排列组合

image-20240718160458457

由我们之前得到的信息可知,应该如下图般配置,配置完成后点击preview查看隐藏信息:

image-20240718160733500

Alpha 之前发现透明度通道没有什么隐藏信息,故不选

Red plane 0含有隐藏信息

Green plane 0含有隐藏信息

Blue plane 0含有隐藏信息

Extract By 我们发现图片上方在关闭通道出现黑白的印记是横向的,因此按row(行)提取像素而不是column(列)

Bit Order 我们知道像素值是按最低位的修改进行隐写的,因此选LSB(像素值最低位作为第一位)

Bit Plane Order 设置RGB通道的顺序,默认RGB

我们发现隐藏信息是一张png图片文件,我们点击Save Bin,将图片保存为.png格式的文件,发现是张二维码图片:

image-20240718161306296

扫一扫即可得到flag

image-20240718161448694

考点:理解LSB隐写原理、学会利用工具

zip伪加密(新)

下载文件,发现里面是一个rar的压缩包,根据题目提示,它是伪加密的。

ZIP压缩包格式

一个ZIP压缩文件由如下三部分组成:压缩源文件数据区、压缩源文件目录区和压缩源文件目录结束标志。具体而言,一个ZIP文件可以按如下方式分解:

[本地文件头+文件数据+数据描述符]{1,n}+目录区+目录结束标识

[本地文件头+文件数据+数据描述符] 构成压缩源文件数据区

{1,n} 表示这部分数据最少出现1次,也可以出现n次,n的数量和压缩前的文件数量一致

目录区 会保存压缩前文件和文件夹的目录信息,这部分数据一般均为明文显示

目录结束标识 存在于整个压缩包的结尾,用于标记压缩的目录数据的结束

(源于《CTF那些事儿》)

更多详细内容可以参考文章:一个zip文件由这样三个部分组成_zip 文件结构-CSDN博客

zip伪加密

原理:通过修改zip压缩包特定的字节(全局方式位标记),使得在打开文件时压缩包被识别为使用了密码加密,但实际上并没有真正加密的技术。

回到题目,我们使用010 editor打开zip文件:

image-20240718164144119

我们可以在压缩源文件数据区中可以找到全局方式位标记,它的值为09 00:

image-20240718164432631

当全局方式位标记的第二个数字(即09 00中的第二个数字9)为奇数时,ZIP文件被识别为加密;而当这个数字为偶数时,文件被视为未加密。因此,我们将09 00改为00 00,保存后就可以直接打开压缩文件了:

image-20240718164512593

image-20240718164611163

考点:理解zip伪加密原理

被嗅探的流量(新)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240719092038619

按照数据包分析思路,我们先进行协议分级:

image-20240719093233897

可以发现HTTP协议占比最高,并且看HTTP协议内容像是在上传媒体文件:

image-20240719093439153

flag可能就隐藏在这上传的文件里面,我们应该如何提取这其中的文件呢?

wireshark功能四:导出文件对象

方法一:导出对象法。这种方法依赖于wireshark自带的解析功能,wireshark可以根据不同的协议自动导出文件,这题主要导出使用http协议传输的文件:

image-20240719093949476

image-20240719094032031

点击全部保存即可,我们依次分析发现upload(3).php中包含一张jpg图片,并且结尾处插入了flag:

image-20240719095437337

当离线流量太大或者传输文件头受损时,这种方法会失效;而且导出对象法支持的协议过少,应用范围有限。

方法二:导出分组字节流法。我们在找到的传输文件的HTTP包的内容进行导出分组字节流:

image-20240719095019572

保存类型默认为.bin文件,但我们可以改成.jpg,并使用010 editor进行分析:

image-20240719095557307

我们也可以在结尾处发现插入的flag。

这是一种完全由人工操作的提取方法(再不济直接把16进制文本复制下来修复),具有广泛的适用性。

方法三:binwalk提取法。利用binwalk对离线流量文件进行检测和提取:

binwalk -e 被嗅探的流量.pcapng

image-20240719102451590

我们发现这道题分解不出来,所以我们使用以下命令指定输出文件:

binwalk -D=jpeg 被嗅探的流量.pcapng

发现图片文件貌似受损,但使用010 editor还是能发现其中隐藏的flag:

image-20240719103609199

binwalk检测的原理是根据文件头特征,如果流量中文件的文件头损坏binwalk也无法提取成功,这时仍需手工提取。

考点:网络流量分析、理解HTTP协议数据包结构、学会提取流量包中的文件

rar(知识巩固题)

下载文件,发现里面是rar格式的压缩包,根据题目提示,这是我们遇到的第三个需要爆破密码的压缩包了,我们直接爆破得到密码:

image-20240719100151196

解开rar文件,获得flag

考点:压缩包密码爆破

qr(简单)

下载文件,发现里面是一张png格式的二维码图片,我们用二维码识别软件QR Research扫一扫,发现flag:

image-20240719103946501

这题应该是一道签到题,能够保证大部分同学做出来

考点:会扫二维码。

镜子里面的世界(知识巩固题)

下载文件,发现里面是一张png图片,我们查看一下貌似什么也没有

steg

按照文件名提示我们应该使用Stegsolve来查看,在此跳过图片隐写思路前两步直接使用Stegsolve打开,调整通道查看图片发现:

image-20240719104431512

image-20240719104446942

image-20240719104500719

我们可以发现,当我们关闭红色通道(red plane 0)、绿色通道或是蓝色通道时,图片的上方出现了黑白的印记,很显然是隐藏的二进制的信息,我们继续使用StegSolve进行分析:

image-20240719104607932

我们可以以文本形式保存,获得flag。相当于我们再次复习了LSB隐写的题目。

考点:理解LSB隐写原理、学会利用工具

ningen(知识巩固题)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240721090813668

我们可以发现EOIMaker是jpg文件的文件尾,后面的unknownPadding[204]块大小为9721h也就是之后的内容无法被PNG模板解析,看文件头是zip压缩文件

根据前文我们进行文件分离,获得加密的ZIP文件:

image-20240721091517118

按照题目提示,密码是四位数字,爆破密码成功:

image-20240721091650680

使用密码解压,获得flag

考点:文件分离、压缩包密码爆破

爱因斯坦(新知识巩固题)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,查看文件属性发现备注:

image-20240721145137033

我们再优先打开010 editor打开图片查看:

image-20240721145256036

发现文件尾部含有插入的zip文件:

image-20240722092544676

提取zip文件,发现加了密,我们使用之前在属性里面看到的字符串尝试,成功提取flag

考点:文件分离、压缩包密码猜测

小明的保险箱(知识巩固题)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,查看文件属性发现备注:

image-20240722094225505

我们再优先打开010 editor打开图片查看,发现文件尾部含有插入的rar文件:

image-20240722094355060

提取zip文件,发现加了密,按照题目提示我们进行密码爆破:

image-20240722094533977

提取出flag

考点:文件分离、压缩包密码爆破

easycap(新)

首先我们用wireshark打开pcap文件:

image-20240722101656710

按照数据包分析思路,我们先进行协议分级:

image-20240722101756885

非常容易,我们可以看见TCP协议传输Data数据内容,我们直接过滤观察数据包:

image-20240722101922519

发现上传了38个Data数据包,每个包包含一个字节,查看前几个包内容可以发现发送的字符串为“FLAG”

也就是说我们将这些Data数据包的内容组合起来就能得到flag

wireshark功能五:数据追踪流

我们的一个完整的数据流一般都是由很多个包组成的,我们在这里跟踪TCP协议数据流可以将Data数据组合:

image-20240722102640306

追踪TCP流可以得到flag

考点:网络流量分析、学会追踪协议流量

隐藏的钥匙(知识巩固题)

下载文件,发现里面是一张jpg图片,我们查看一下貌似什么也没有

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240722103414585

模板解析不好,我们直接搜索是否存在”flag“字符串,发现隐藏的flag:

image-20240722103507522

按照提示经过base64解码,得到了flag

image-20240722103603681

考点:寻找插入隐藏flag、理解base64编码

另外一个世界(知识巩固题)

下载文件,发现里面是一张jpg图片,我们查看一下貌似什么也没有

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240722104046568

“flag”查询未果,但发现文件结尾插入了规律的二进制字符串:

image-20240722104126065

我们进行二进制转码,得到了隐藏的flag:

image-20240722104222294

考点:寻找发现插入隐藏信息、理解二进制转码

神秘龙卷风(新编码)

下载文件,发现里面是rar格式的压缩包,根据题目提示,这是我们遇到的不知道多少个需要爆破密码的压缩包了,我们直接爆破得到密码:

image-20240722104502238

打开之后,发现了奇怪的内容:

image-20240722104543453

txt文件内容由“+“”.“”>“三种字符组成,这是非常著名的Brainfuck编码,我们只能使用相关代码解码(这里我使用了brainfuck解码工具,在线的工具好像失效了):

image-20240722105942135

得到flag

考点:压缩包密码爆破、理解brainfuck编码

数据包中的线索(知识巩固题)

首先我们用wireshark打开pcapng文件:

image-20240722141747426

按照数据包分析思路,我们先进行协议分级:

image-20240722141812715

发现HTTP协议发送的Line-base text data占比最多,我们优先过滤查看:

image-20240722141911878

追踪HTTP流,发现发送的数据经过了base64编码:

image-20240722142012506

解码,发现是张图片,获得隐藏在图片中的flag:

image-20240722112640586

考点:网络流量分析、学会追踪协议流量、base64解码图片文件

FLAG(知识巩固题)

下载文件,发现里面是一张png格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240722142308181

没有宽高错误,也没有隐藏的插入信息,我们使用StegSolver进入第二步:

image-20240722142643693

image-20240722142654708

image-20240722142709581

我们可以发现,当Red plane 0、Green plane 0、Blue plane 0时,图片顶部出现规律的黑白组合,我们进一步分析LSB隐写:

image-20240722142843904

可以发现内部隐藏了一个ZIP文件,提取会报错但我们硬提取,文件提取出来发现发现是elf文件:

image-20240722145019516

我们用linux系统运行看看:

image-20240722155912592

发现了flag

考点:理解LSB隐写原理、学会利用工具、理解ELF文件

假如给我三天光明(新工具)

下载文件,发现里面是一张jpg格式的图片和一个压缩包

图片中下面有信息,按照提示应该是盲文,我们使用在线解密:在线盲文翻译器 (lddgo.net)

(盲文输入器也在网站下方)

image-20240726142816238

输出文本出现乱码,我们盲文类型:

image-20240726142918199

猜测这是zip压缩包的解压密码,于是我们解压文件,发现了一个音频文件

音频隐写思路:

1. 听一下,再查看音频的属性是否藏了东西
2. 使用Audacity观察音频是否藏有信息
3. 使用010 Editor、strings等其他工具发现插入隐藏信息,并使用binwalk和foremost尝试自动提取
4. 使用steghide、SilentEye、mp3stego等其他特殊工具提取隐写信息

回到题目,我们听到了熟悉的摩斯电码,因此推测与摩斯电码有关

音频的属性没有什么信息,我们接下来使用Audacity打开音频

Audacity

可以查看音频的波形图,有些信息可能就藏在波形图里面:

image-20240726143552953

我们可以发现音频的波形图按照类似于摩斯电码的“-“和”.“组成,我们进行解码:

image-20240726144230220

解出flag

(按照buuctf的格式应去掉”CTF“并小写,写为flag{wpei08732?23dz})

考点:盲文解密、摩斯电码音频

后门查杀(新工具)

下载文件,发现里面是一个网站目录的文件夹

(如果你打开了杀毒软件,那么很快有问题的文件就会被发现并且删除)

我们首先打开文件夹,发现小白搭网站的目录结构:

image-20240726144804092

一般来说,我们应该逐个查询各个文件寻找是否存在木马文件,但我们有自动化的工具可以帮我们实现这一点

D盾查杀工具

D盾是目前最为流行和好用的web查杀工具,同时使用也简单方便,在web应急处置的过程中经常会用到。D盾的功能比较强大, 最常见使用方式包括如下功能:

1、查杀webshell,隔离可疑文件;

2、端口进程查看、base64解码以及克隆账号检测等辅助工具;

3、文件监控。

下载地址:D盾防火墙 (d99net.net)

我们将网站根目录文件放入D盾查杀工具扫描,发现了可疑文件:

image-20240727111924516

我们优先重点观察第三个风险级别为5的文件:

image-20240727112030231

image-20240727112351601

找到了webshell,套上flag{}提交

什么是webshell可以查看这篇文章(待补充)

考点:使用工具扫描寻找可疑后门文件

webshell后门(知识巩固题)

下载文件,发现里面是一个网站目录的文件夹

我们首先打开文件夹,发现朋友搭网站的目录结构:

image-20240727112920135

我们将网站根目录文件放入D盾查杀工具扫描,发现了可疑文件:

image-20240727113036113

我们查看第一个文件,找到了webshell,套上flag{}提交(与上一题的flag一模一样……)

image-20240727113304088

来首歌吧(知识巩固题)

下载文件,发现里面是一个wav格式的音频文件

播放音乐,发现是《NyanCat》的循环播放

按照音频隐写思路,音频的属性没有什么信息,我们接下来使用Audacity打开音频:

image-20240727113808621

我们可以发现这首歌有两个音频轨道,右声道轨道放歌,左声道轨道隐藏着信息

我们将右声道静音,听听左声道的信息,发现是摩斯电码,我们按照波形图进行解密:

image-20240727140953000

解出flag

考点:音频双音轨隐藏信息、摩斯电码音频

面具下的flag(较难)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240728230311147

我们可以在结尾发现插入隐藏的ZIP文件,我们进行文件分离:

image-20240728230535809

手工提取失败,我们尝试利用binwalk工具自动提取:

binwalk mianju.jpg -e

image-20240728230812906

文件分离出一个压缩包文件,我们尝试解压,发现压缩包被加密

按照遇到含有密码的压缩包思路,题目没有给出密码的相关线索,因此我们使用010editor观察zip文件是否存在伪加密的情况:

image-20240728231242191

image-20240728231806809

可以发现这个ZIP文件的目录区存在伪加密的情况,我们进行修改并打开文件:

image-20240728231823231

我们提取出一个vmdk文件

vmdk文件

VMDK 是 VMware Virtual Machine Disk(虚拟机磁盘)的缩写,它是 VMware 虚拟化软件使用的虚拟磁盘映像文件格式之一。VMDK 文件存储了虚拟机的硬盘数据,类似于实际计算机系统中的物理硬盘。

VMDK 文件是一种二进制文件,用于模拟和存储虚拟机的硬盘。它包含了虚拟机操作系统和应用程序所需的文件和数据,包括操作系统文件、应用程序、配置文件和用户数据等。在运行虚拟机时,VMware 虚拟机管理器会读取和操作 VMDK 文件,提供虚拟机所需的存储和访问功能。

(来源于vmdk是什么文件?-CSDN博客

我们可以使用7z来提取vmdk虚拟磁盘文件中的内容:

image-20240728232233959

我们得到两个文件夹:

image-20240728232310773

我们在key_part_one中发现了_NUL文件,我们查看其内容:

image-20240728232355570

按照前面的经验,我们可以知道这个是brainfuck编码的内容,我们进行解码

(这里找到了在线解码网站:https://www.splitbrain.org/services/ook)

image-20240728232826011

我们得到了flag的碎片1

我们在key_part_two中发现了where_is_flag_part_two.txt文件,我们查看其内容:

image-20240728233503045

里面没有内容,我们查看文件的属性也没发现什么有用的信息:

image-20240728233745250

我们使用7z打开vmdk文件查看详情:

image-20240728233612481

image-20240728234222415

我们可以发现where_is_flag_part_two.txt文件存在1交替数据流

交替数据流

NTFS(一种文件系统,用于明确磁盘或分区上的文件的方法和数据结构)交换数据流(ADS)简介

在NTFS文件系统中存在着NTFS交换数据流(Alternate Data Streams,简称ADS),这是NTFS磁盘格式的特性之一。每一个文件,都有着主文件流和非主文件流,主文件流能够直接看到;而非主文件流寄宿于主文件流中,无法直接读取,这个非主文件流就是NTFS交换数据流。
ADS的作用在于,它允许一个文件携带着附加的信息。例如,IE浏览器下载文件时,会向文件添加一个数据流,标记该文件来源于外部,即带有风险,那么,在用户打开文件时,就会弹出文件警告提示。再如,在网址收藏中,也会附加一个favicon数据流以存放网站图标。

要使用7z查看这个文件的隐藏文件,我们使用7z的交替数据流的功能:

image-20240728233910870

image-20240728234710323

这是OOK编码,我们同样可以使用上面的网站进行解码:

image-20240728234824617

我们得到了flag碎片2,拼凑出了完整的flag

考点:文件分离、使用工具分析vmdk文件、理解brainfuck编码、理解交替数据流隐藏文件、理解ook编码

荷兰宽带数据泄露(较难新工具)

下载文件,发现里面是一个.bin格式的配置文件(文件名为config的一般为配置文件)

bin文件

bin是binary的缩写,译为“二进制”。binary file二进制文件是一个非text file文本文件的计算机文件。binary file是一种计算机文件格式,它以二进制编码表示文件的内容。这些文件通常包含计算机程序或数据,例如软件/固件、操作系统、文档、图像、音频和视频等。
在嵌入式软件开发中,binary file通常是软件固件或操作系统的映像文件,binary file通常用于将代码和数据加载到嵌入式系统的nonvolatile memory非易失性存储器(如flash memory)或其他存储器中。此外,binary file还可以用于将数据从一个嵌入式系统传输到另一个嵌入式系统。

在操作系统中,可执行文件和库文件通常以二进制格式存储。

在网络通信中,binary file可以被用作数据传输的格式,如HTTP请求和响应、SMTP邮件等。

(来源自文章【嵌入式烧录/刷写文件】-3.1-详解二进制Bin格式文件_bin文件结构-CSDN博客

一般来说我们可以使用十六进制编辑器查看.bin文件的内容,但我们使用010editor打开发现是一片乱码:

image-20240729002656250

由题目提示可以猜测,”宽带数据泄露“可以猜测题目的config.bin文件为一路由器的配置文件,我们可以使用RoutePassView工具查看配置文件具体内容

RoutePassView功能:从路由器配置文件中恢复密码

此应用程序允许我们从路由器创建的配置文件中恢复密码或其他数据,包括 ISP 的登录用户/密码、路由器的登录密码和无线密钥,如果我们忘记了这些密码但我们有路由器配置的备份文件,我们可以从路由器配置文件中恢复密码。下载地址:RouterPassView - Recover lost password from router backup file on Windows (nirsoft.net)(官网下载)

路由密码获取Routerpassview1.88汉化绿色版 完美解决Hello123World - 『精品软件区』 - 吾爱破解 - LCG - LSG |安卓破解|病毒分析|www.52pojie.cn(汉化版下载)

我们打开软件,导入配置文件可以查看相关信息:

image-20240729003650557

题目的提示并不充分,我们应用这个软件是为了寻找路由器配置的用户名、密码等信息的,因此flag很有可能就是路由器配置的用户名、密码等信息

我们寻找相关配置字段:

image-20240729003918307

将其包裹上flag{},即可过关

考点:理解.bin文件作用、使用工具分析路由配置文件

九连环(知识巩固题新工具)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240729004759090

按照模板解析除了很多层的东西,看上去很有可能插入了隐藏文件

手动提取其中的隐藏文件看上去有点困难,我们使用binwalk自动提取:

binwalk 123456cry.jpg -e

image-20240729005101964

文件分离出两个加密的压缩文件,我们尝试以图片文件的文件名“123456cry”作为密码输入,失败了
因此我们逐个分析压缩包的伪加密情况,发现了这个压缩包的一个deFlags为“2049”而其他的deFlags为“2048”,判断存在伪加密:

image-20240729005737884

我们进行修改,解压文件:

image-20240729005934431

又是一张图片,我们继续按照图片隐写的思路进行分析

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240729010053857

并没有发现什么东西,使用了StegSolve也没有看出任何隐藏信息,因此我们开始使用特定工具分析图片包含的隐藏信息。此类特定工具很多,我们将按顺序一一尝试

Steghide——最优先的特定图片隐写工具

Steghide 是一个可用于隐写术的工具。它允许您在音频和图像文件中嵌入秘密信息,包括 JPEG、BMP、WAV 和 AU 文件

我们在kali中使用命令:

steghide extract -sf good-已合并.jpg 

-sf 指定文件

image-20240729010920627

Enter passphrase 输入密码,没有密码就直接回车

我们可以发现我们的图片中提取除了ko.txt的隐藏文件:

image-20240729011049166

我们对压缩包进行解压,得到flag

考点:文件分离、理解zip伪加密原理、使用了特定工具进行的图片文件隐写

被劫持的神秘礼物(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240729131758281

按照数据包分析思路,我们先进行协议分级:

image-20240729131824837

我们可以发现应用层HTTP协议占比最高,应该优先分析:

image-20240729132042568

我们可以发现一些HTTP请求报文,在编号为4的数据包可以发现主机向服务器使用POST方式请求上传了“name”和“word”参数,我们可以猜测这是账号和密码,按照题目需求,我们进行MD5加密,得到了flag:

image-20240729132600503

考点:网络流量分析、理解HTTP协议数据包结构

[BJDCTF2020]认真你就输了(新)

下载文件,发现里面是一个xls格式的表格文件,我们点击查看:

image-20240729133228804

里面全是乱码,但我们可以看出存在ZIP格式文件头字符“PK”,我们将文件后缀改为.zip后打开查看:

image-20240729133906830

我们可以看见有很多文件夹,因为如今的office办公软件的输出文件其实都是一个压缩包,包含着文件的xml文件、图片、视频等所有素材。

经过一番搜寻,我们最终找到了flag:

image-20240729135823980

考点:理解office文件是一堆文件的压缩文件

被偷走的文件(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240729140001399

按照数据包分析思路,我们先进行协议分级:

image-20240729140430541

我们可以发现UDP协议占比最高,但存在基于TCP协议的FTP文件传输协议,我们优先查看传输的文件:

image-20240729140523579

可以发现编号为49的ftp数据包传输了名为“flag.rar”的文件,我们导出对象:

image-20240729140754599

我们没有任何其他的密码提示,rar格式不存在伪加密的情况,因此我们开始一边进行密码爆破一边继续分析

密码爆破成功,我们解压文件得到了flag:

image-20240729141419696

考点:网络流量分析、理解FTP协议数据包结构、学会提取流量包中的文件、压缩包密码爆破

[BJDCTF2020]藏藏藏(知识巩固题)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240729141908485

我们可以在结尾发现插入隐藏的ZIP文件,我们进行文件分离,得到的压缩包中含有一个docx文档,我们打开查看:

image-20240729142347398

是一个二维码,我们进行扫描得到了flag:

image-20240729142540479

考点:文件分离

[GXYCTF2019]佛系青年(新编码知识巩固题)

下载文件,发现是一个加密的压缩包:

image-20240729142904757

题目没有提示,我们优先查看zip的伪加密情况:

image-20240729143041507

可以发现一处deFlags的值为“9”,与其余的deFlags值“0”不同,在此修改后成功解压文件:

image-20240729143419185

我们优先查看txt文本文件,打开发现:

image-20240729143456455

底下是互联网著名的佛曰加密,我们在进行解密得到了flag:

image-20240729143757154

(现在网上在线的佛曰解密多是新版佛曰,因此这里使用了解密工具“[随波逐流]CTF编码工具 V5.4 20140328”)

考点:理解zip伪加密原理、理解佛曰加解密

[BJDCTF2020]你猜我是个啥(知识巩固题)

下载文件,发现是一个损坏的压缩包:

image-20240729144045042

我们优先使用010 editor进行分析,发现它应该是一个png格式的图片:

image-20240729144154699

我们直接将后缀名修改为.png,得到图片:

image-20240729152237320

扫描二维码,被骗了:

image-20240729152257061

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看,在结尾处发现了插入隐藏的flag:

image-20240729152430294

考点:分析十六进制文件头

刷新过的图片(新工具)

下载文件,发现里面是一张jpg格式的图片

按照题目提示,这道题是使用特殊的隐写工具隐藏信息的,因此我们需要找到使用的是什么工具

根据“刷新”可以猜测出是使用了F5-steganography工具进行的隐写,因为网页的”刷新“与“F5”相关联

F5-steganography

jpeg/jpg文件,是一种使用DCT频域来描述的一个图像的文件格式
而F5隐写算法,就是针对jpeg/jpg格式文件在频域的隐写术
工具下载地址:GitHub - matthewgao/F5-steganography: F5 steganography

此工具使用的是java语言,我们输入命令:

java -mx40M Extract Misc.jpg

-mx40M 不清楚做什么用的,按照官方文档说使用这样的命令进行解密

image-20240729154724756

生成了隐写信息的输出output.txt:

image-20240729154916722

我们可以发现zip文件的文件头字符“PK”,因此我们修改后缀,解压文件发现需要密码:

image-20240729155029179

我们使用010 editor进行分析,发现是伪加密:

image-20240729155113157

修改后即可解压获得flag

考点:使用了特定工具进行的图片文件隐写、理解zip伪加密原理

秘密文件(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240729155618650

按照数据包分析思路,我们先进行协议分级:

image-20240729155659750

我们可以发现TCP协议占比最高,但存在基于TCP协议的FTP文件传输协议,我们优先查看传输的文件:

image-20240729155543971

可以发现编号为95的ftp数据包传输了名为“6b0341642a8ddcbeb7eca927dae6d541.rar”的文件,我们导出对象:

image-20240729155857287

导不出来,因此我们使用foremost工具进行导出:

foremost 305df1f78bef4ccfd2a3bd0fe4a6c0d7.pcapng

image-20240729160138658

压缩包被加密了,我们没有任何其他的密码提示,rar格式不存在伪加密的情况,因此我们开始一边进行密码爆破一边继续分析

密码爆破成功,我们解压文件得到了flag:

image-20240729160315665

考点:网络流量分析、理解FTP协议数据包结构、学会提取流量包中的文件、压缩包密码爆破

snake(脑洞)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240731003904864

发现文件尾部有插入隐藏zip文件,我们进行文件分离并解压得到密文和密钥:

image-20240731004006928

cipher文件是乱码,key文件是base64编码后的密文,我们进行解码:

image-20240731004133879

key的内容是“Nicki Minaj最喜欢的关于蛇的歌是什么?”

我们之间上网搜索,明白了Nicki Minaj是一位歌手,她唱过一首名为《Anaconda》(蟒蛇)的歌

image-20240731004556992

那么我们可以猜测key的值为“Anaconda”

我们还是不知道cipher是如何加密的,于是我们上网搜索相关的加密方式(由于只有一个key作为密钥,因此我们可以猜测这是对称加密的方式):

image-20240731005046891

我们找到了名为“Serpent”(蛇)的加密方式,我们使用在线解密工具(Serpent Encryption – Easily encrypt or decrypt strings or files (online-domain-tools.com)不知道为什么其他的网址都不太好使所以用了这个)进行解密:

image-20240731005830456

key的值不为“Anaconda”,那我们可以尝试一下“anaconda”

image-20240731005916384

得到了正确的flag

考点:文件分离、学会用搜索引擎去搜索相关加密方式

[BJDCTF2020]鸡你太美(新知识巩固题)

下载文件,发现里面是两张gif格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240731130838172

image-20240731130822955

GIF文件格式简介

参考文章:https://blog.csdn.net/Swallow_he/article/details/76165202

回到题目,我们可以发现“篮球副本.gif”文件文件头损失,我们进行修复:

我们以文本格式进行编辑,在文件头的部分添加4字节数据(由“篮球.gif”和“篮球副本.gif”两个文件对比可发现损坏的文件头缺少四字节的内容)

image-20240731131031065

image-20240731131024508

返回到十六进制的编辑方式,我们将添加的4字节数据更改为文件头:

image-20240731131256106

再次运行模板发现成功识别出gif文件了,我们可以直接打开图片查看内容:

image-20240731131344815

得到了flag

考点:文件头修复

[BJDCTF2020]just_a_rar(知识巩固题)

下载文件,发现里面是一个rar格式的压缩文件

按照文件名提示的“四位数”,不用说直接上爆破:

image-20240731131621845

解压后得到了一张JPG格式的图片,我们按照图片隐写思路查看文件属性找到flag:

image-20240731134935819

考点:压缩包密码爆破

菜刀666(较难知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240731143953960

按照数据包分析思路,我们先进行协议分级:

image-20240731144038478

我们可以发现应用层HTTP协议占比最高,应该优先分析:

image-20240731144132518

可以发现http协议大部分是在与上传的文件“/upload/1.php”进行交互,可以推测这是上传的webshell,菜刀工具可以通过这个webshell对服务器做出许多操作。我们可以逐一追踪流查看菜刀流量所做的操作:

image-20240731144617061

根据响应包返回的内容我们可以推测tcp流1在探测服务器的主机信息

image-20240731144732093

根据响应包返回的内容我们可以推测tcp流2在探测服务器的目录

image-20240731144844991

根据响应包返回的内容我们可以推测tcp流3攻击机在向服务器请求“xxd_8.0.1257-2_amd64.deb”这个文件

image-20240731145157065

image-20240731145305626

根据响应包返回的内容我们可以推测tcp流4、5在探测服务器的目录,我们可以发现flag.txt的身影

image-20240731145331057

根据响应包返回的内容我们可以推测tcp流6攻击机在向服务器请求“vim-common_8.0.1257-2_all.deb”这个文件

image-20240731145640677

根据请求包发送的内容我们可以推测tcp流7在上传一个文件,再请求回显当前目录我们可以发现多了一个6666.jpg的文件,我们可以推测这就是上传的文件,我们复制下来进行解码查看(注意上传图片文件的参数是“z2”):

image-20240731150127287

image-20240731150226764

我们可以发现上传的是一张图片文件,尝试了之后图片的内容并不是flag,我们继续分析:

image-20240731150346736

根据响应包返回的内容我们可以推测tcp流8攻击机在向服务器请求“less_487-0.1_amd64.deb”这个文件

image-20240731150452686

根据响应包返回的内容我们可以推测tcp流9创造了一个“hello.zip”文件,并且向服务器请求了这个文件,我们可以将返回包的zip文件内容复制进行手动文件提取,或者使用foremost工具自动提取:

image-20240731151203039

解压发现需要密码,我们尝试将前面的图片文件的内容进行尝试成功,得到flag

考点:网络流量分析、理解webshell的利用方式

[BJDCTF2020]一叶障目(知识巩固题)

下载文件,发现里面是一张png格式的图片

按照图片隐写思路,第一步使用TweakPNG工具发现图片的crc校验出现错误,因此可能存在PNG宽高隐写

image-20240731151927322

我们使用之前写的PNG宽高爆破脚本,可以得到正确的图片宽高,我们进行修改即可:

image-20240731152510722

image-20240731152616962

打开图片,发现了隐藏的flag

image-20240731152647832

考点:PNG宽高隐写、理解爆破PNG宽高原理

[SWPU2019]神奇的二维码(较难知识巩固题)

下载文件,发现里面是一张png格式的二维码图片,我们用二维码识别软件QR Research扫一扫,发现并没有flag

image-20240731152927645

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240731153429493

发现了插入隐藏的rar文件,我们进行手动文件分离得到了:

image-20240731153532703

鉴定为base64编码,我们进行解码,提交发现这并不是flag

image-20240731154952740

这说明这张图片还有其他隐藏的信息,我们再使用binwalk自动提取工具进行提取查看:

binwalk BitcoinPay.png -e

image-20240731154228690

藏的东西可真多啊……

我们逐一查看分析:

716A.rar 包含的内容就是“flag.jpg”与“看看flag在不在里面_.rar”两个文件,压缩文件显然加密了

我们尝试使用”encode.txt“的解码内容,成功解压:

image-20240731155123147

根据文件名这么讨嫌的说法已经可以猜测flag不在里面了……我们先继续分析其他的文件

7104.rar 就是前文发现的“encode.txt”

17012.rar 包含了“flag.doc”

image-20240731155226511

一大串乱码鉴定为base64编码,我们进行解码,发现密文貌似没什么变化,这可能是进行了多次base64编码,我们也进行多次base64解码:

image-20240731155534805

总共进行了20次base64编码,得到了一字符串,尝试提交发现也不是flag

18394.rar 加密的压缩文件

使用之前得到的字符串作为密码成功解压,得到了“good.mp3”,一听鉴定为摩斯电码,我们使用Audacity观察其声波输入摩斯电码进行解密:

image-20240731160023100

image-20240731160415960

(按照buuctf的格式应小写,写为flag{morseisveryveryeasy})

考点:文件分离、压缩文件密码猜测、理解base64多次编码、摩斯电码音频

[BJDCTF2020]纳尼(知识巩固题)

下载文件,发现里面是一张gif格式的图片与提示文件

image-20240731160645517

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240731160756137

可以发现和坤坤那题一样,GIF文件头缺失,我们进行修复即可:

image-20240731160857569

我们查看一下发现flag都是一段一段的出现又一闪而过,我们可以使用StegSolver进行逐帧分析:

image-20240731161103858

image-20240731161119777

image-20240731161134451

image-20240731161154113

将字符串拼接起来并进行base64解码,得到flag

考点:文件头修复、利用工具逐帧查看gif文件图像

[HBNIS2018]excel破解(知识巩固题)

下载文件,发现里面是一个xls格式的表格文件,我们点击查看发现加密了:

image-20240731161519666

我们优先使用010 editor查看文件内容,搜索“flag”,最终找到相关字段:

image-20240731161916275

考点:学会使用010 editor查看打不开的文件

[HBNIS2018]来题中等的吧(知识巩固题)

下载文件,发现里面是一张png格式的图片,按照条形码只有两种“短”和“长”的形态可以猜测这是摩斯电码:

image-20240731162210328

我们进行解密,得到了flag

image-20240731162622895

考点:理解摩斯电码

梅花香之苦寒来(较难新工具)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步可以发现详细信息中隐藏着提示:

image-20240803133523612

我们再优先打开010 editor打开图片查看:

image-20240803134007822

我们可以在结尾发现插入隐藏的信息,我们可以分析出这是十六进制编码的内容,我们进行解码:

image-20240803204457750

我们得到了一大堆的坐标格式的内容,我们保存输出结果。根据图片属性中给出的提示,我们可以推测这是使用画图工具绘出图像。在此我们可以使用gnuplot工具(当然也可以使用python具有绘图功能的库如matplotlib)

gnuplot——一个命令行驱动的科学绘图工具

gnuplot可将数学函数或数值资料以平面图或立体图的形式画在不同种类终端机或绘图输出装置上。它是由Colin Kelley 和 Thomas Williams于1986年开发的绘图程序发展而来的,可以在多个平台下使用。gnuplot既支持命令行交互模式,也支持脚本。

官网下载地址:gnuplot homepage

在使用gnuplot之前,我们应该把输出的坐标更改为gnuplot可以识别的模式,我们可以使用记事本的编辑功能或者自己写脚本:

with open('download.txt', 'r') as res:  # 坐标格式文件比如(7,7)
    re = res.read()
    res.close()

with open('gnuplottxt.txt', 'w') as gnup:   # 将转换后的坐标写入gnuplotTxt.txt
    re = re.split()
    tem = ''
    for i in range(0, len(re)):
        tem = re[i]
        tem = tem.lstrip('(')
        tem = tem.rstrip(')')
        for j in range(0, len(tem)):
            if tem[j] == ',':
                tem = tem[:j] + ' ' + tem[j+1:]
        gnup.write(tem + '\n')
    gnup.close()

image-20240803211238615

我们打开gnuplot.exe,使用以下命令:

load (gnuplottxt.txt的文件路径,如果直接把txt文件放到gnuplot的文件路径下可以略过这一步)
plot "gnuplottxt.txt"

即可绘出一副二维码,我们进行扫描获得flag

image-20240803212903163

考点:利用十六进制编辑器找到隐藏的信息、学会使用数学坐标绘图工具

[ACTF新生赛2020]outguess(新工具)

下载文件,发现里面是一张jpg格式的图片和flag.txt文件的提示(其他文件名带“._”的文件可以忽略,他们并不是题目的一部分)

image-20240804152931224

根据flag.txt和题目名的提示我们可以明白这题目使用了特殊的隐写工具——outguess

outguess

outguess是一款开源的隐写工具,可以隐藏信息在图像和声音文件中。它使用了一种基于数据的方法,而不是基于修改的方法来隐藏信息,这使得它更加难以被检测到。

使用outguess隐写信息需要加密信息的密码key,也就是说我们需要找到key来找出jpg图片中隐写的信息。

按照图片隐写思路,第一步我们在图片属性中的详细信息中发现了内容:

image-20240804153235434

这是一个很有意思的编码方式,叫做“社会主义核心价值观编码”,我们可以使用在线或者本地工具进行解码:

image-20240804153406380

解码出“abc”,我们可以推断出这就是我们需要的key,现在我们可以使用以下命令使用outguess进行解密了:

outguess -k 'abc' -r mmm.jpg flag.txt 

-k 指定key

-r 指定输入文件和输出文件

image-20240804153712562

成功解出flag

考点:理解特殊编码方式、使用了特定工具进行的图片文件隐写

谁赢了比赛?(较难知识巩固题)

下载文件,发现里面是一张png格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240804154841086

我们可以在结尾发现插入隐藏的rar文件,我们进行文件分离,得到的压缩包中含有一张gif图片和flag.txt文件,我们尝试打开gif图片却发现压缩文件被加密了,因为没有找到其他提示所以我们优先进行爆破:

image-20240804155124847

image-20240804155208562

解压文件,发现这个gif真的有够长的,我们先使用stegsolve来逐帧查看,在第310帧发现了奇怪的图片:

image-20240804155523173

尝试上交发现并不是flag,我们先将这一帧图片进行保存再继续分析:

image-20240804155759984

最后我们发现在关闭红色通道(red plane 0)时会出现一张二维码,我们进行扫码即可获得flag

image-20240804155942503
考点:LSB隐写

穿越时空的思念(知识巩固题)

下载文件,发现里面是一个mp3格式的音频文件

按照音频隐写思路,我们听出音频中含有摩斯电码的声音,音频的属性没有什么信息,我们接下来使用Audacity打开音频:

image-20240804174435511

发现右声道存在摩斯电码,我们进行解码:

image-20240804174812208

得到flag(这里出现了两段摩斯电码,第二段是第一段摩斯电码前半部分的重复内容,按照题目提示flag为小写的32位字符,我们不用管就行)

考点:音频双音轨隐藏信息、摩斯电码音频

[WUSTCTF2020]find_me(知识巩固题)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步我们在图片的备注中发现了盲文:

image-20240804175130200

我们可以发现盲文的末尾含有等号,这说明这并不是真正的盲文内容,应该时经盲文加密后的内容(盲文翻译和盲文加密是两个东西)

我们使用相关在线网站解密得到flag:

image-20240804175647961

考点:会查看图片属性、理解盲文加密与盲文翻译的区别

[SWPU2019]我有一只马里奥(知识巩固题)

下载文件,发现里面是一个exe格式的可执行文件

我们先直接运行,它会生成一个1.txt:

image-20240804180454010

根据提示我们可以知道这是NTFS文件隐写,在前文交替数据流的内容中已经简介了这种隐写方式了,文件偷偷携带着附加的信息。

我们可以使用7z打开这个文件来探索它的隐藏内容,发现了flag:

image-20240804180752045

考点:理解NTFS文件隐写

[GUET-CTF2019]KO(知识巩固题)

下载文件,发现里面是一份txt格式的文本:

image-20240804180954268

鉴定为brainfuck编码,我们进行解码:

image-20240804181127544

得到了flag

考点:理解brainfuck编码

[ACTF新生赛2020]base64隐写(新)

下载文件,发现里面是一份txt格式的文本(还有公众号的二维码图片,扫码获得提示):

image-20240804181542199

我们可以看到一串串的base64编码内容,再根据题目名的提示我们可以判断这里存在base64隐写。

base64隐写原理(引用自文章:Base64隐写 | Lazzaro (lazzzaro.github.io)

原理

Base64的编码过程就是将文本字符对应成二进制后,再六个一组对应成索引,转为编码字符。如果字符串长度不是3的 倍数,则对应的二进制位数不是6的倍数,需要在末尾用0填充。若剩1个字符则在编码结果后加2个‘=’;若剩2个字符则 加1个‘=’。

Base64的解码过程,即先丢弃编码后面的‘=’,然后将每个base64字符对应索引转为6bit的二进制数,再8个一组转为ASCII码字符完成解码,最后若剩下不足8位的,则全部丢弃。

所以某些bit位在解码时会被丢弃,换句话说,这些bit值不会对解码结果产生影响。一个简单直观的例子就是QUJDRA和QUJDRC解码后都是ABCD。由此我们便可以将隐藏信息插入这些bit位中实现隐写。

这里再给个例子:

Terra这一字符串的长度为5,非3的倍数,在转为6位二进制字串时添加了两个0(红色加粗部分)。编码后的结果为VGVycmE=:

在这里插入图片描述

倘若添加的二进制值不全为0,虽然会改变“=”号前最后一个字符的值,使编码后的字符串变为VGVycmH=。但该字符串进行Base64解码的结果依然是Terra:

在这里插入图片描述

末尾有两个“=”字符的编码字符串同样如此,Lucy字符串正常编码应为THVjeQ==

在这里插入图片描述

修改后为THVjeV==,同上,进行base64解码结果依然是Lucy

在这里插入图片描述

若像这样对多个base64编码字符串结尾进行修改,即可隐藏更多的信息,这就是base64隐写。

(原文章:[MISC]Base64隐写-CSDN博客

一串Base64的编码最多也只有4bit的隐写空间,所以实现隐写往往需要大量编码串。隐写时把明文的每个字符用8位二进制数表示,由此将整个明文串转为bit串,按顺序填入Base64编码串的可隐写位中即可实现隐写。

加密

# -*- coding: utf-8 -*-
import base64
flag = 'flag{Base64isF4n}' #flag
bin_str = ''.join([bin(ord(c)).replace('0b', '').zfill(8) for c in flag])
base64chars = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/'
with open('0.txt', 'rb') as f0, open('1.txt', 'wb') as f1: #'0.txt'是明文, '1.txt'用于存放隐写后的 base64
	for line in f0.readlines():
		rowstr = base64.b64encode(line.replace('\n', ''))
		equalnum = rowstr.count('=')
		if equalnum and len(bin_str):
			offset = int('0b'+bin_str[:equalnum * 2], 2)
			char = rowstr[len(rowstr) - equalnum - 1]
			rowstr = rowstr.replace(char, base64chars[base64chars.index(char) + offset])
			bin_str = bin_str[equalnum*2:]
		f1.write(rowstr + '\n')

解密

d='''str
'''
e=d.splitlines()
binstr=""
base64="ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
for i in e :
    if i.find("==")>0:
        temp=bin((base64.find(i[-3])&15))[2:]
        #取倒数第3个字符,在base64找到对应的索引数(就是编码数),取低4位,再转换为二进制字符
        binstr=binstr + "0"*(4-len(temp))+temp #二进制字符补高位0后,连接字符到binstr
    elif i.find("=")>0:
        temp=bin((base64.find(i[-2])&3))[2:] #取倒数第2个字符,在base64找到对应的索引数(就是编码数),取低2位,再转换为二进制字符
        binstr=binstr + "0"*(2-len(temp))+temp #二进制字符补高位0后,连接字符到binstr
str=""
for i in range(0,len(binstr),8):
    str=str+chr(int(binstr[i:i+8],2)) #从左到右,每取8位转换为ascii字符,连接字符到字符串
print(str) 

我们可以使用上面的脚本进行解密,或者使用另一个非常实用的自动化工具:puzzlesolver

它可以自动帮我们进行base64隐写的解密,直接获得flag:

image-20240804201556633

考点:理解base64隐写

[GXYCTF2019]gakki(新)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240804201803411

我们可以在结尾发现插入隐藏的rar文件,我们进行文件分离,压缩文件被加密了,因为没有找到其他提示所以我们优先进行爆破:

image-20240804202153661

解压出的flag.txt中包含一大堆乱序的字符:

image-20240804202246502

这种乱序的文本在杂项题目里面我们优先进行字频统计并观察结果继续分析,在此我们可以使用网上有的脚本:(原文章[BUUCTF:GXYCTF2019]gakki_[gxyctf 2019]gakki-CSDN博客):

# -*- coding:utf-8 -*-

#Author: mochu7
alphabet = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ1234567890!@#$%^&*()_+- =\\{\\}[]"
strings = open('./flag.txt').read()

result = {}
for i in alphabet:
	counts = strings.count(i)
	i = '{0}'.format(i)
	result[i] = counts

res = sorted(result.items(),key=lambda item:item[1],reverse=True)
for data in res:
	print(data)

for i in res:
	flag = str(i[0])
	print(flag[0],end="")

puzzlesolver也拥有字频统计的功能:

image-20240804203356786

或者使用在线工具https://uutool.cn/str-statistics/:

image-20240804203225302

我们可以发现字频统计的结果中排列在前18的字符包含了flag

考点:文件分离、字频统计

[MRCTF2020]ezmisc(知识巩固题)

下载文件,发现里面是一张png格式的图片

按照图片隐写思路,第一步使用TweakPNG工具发现图片的crc校验出现错误,因此可能存在PNG宽高隐写

image-20240804203803317

我们使用之前写的PNG宽高爆破脚本,可以得到正确的图片宽高,我们进行修改即可:

image-20240804204021940

image-20240804204058363

打开图片,发现了隐藏的flag

image-20240804204122947

考点:PNG宽高隐写、理解爆破PNG宽高原理

[HBNIS2018]caesar(知识巩固题)

下载文件,发现里面是一份txt格式的文本:

image-20240804204421159

根据密文特征与题目提示,我们可以确定加密方式为类凯撒密码的替换式密码加密,我们直接进行解密得到flag:

image-20240804204553622

考点:理解类凯撒密码替换式密码加密

[HBNIS2018]低个头(脑洞)

下载文件,发现里面是一份txt格式的文本:

image-20240804204715966

根据密文特征与题目提示,我们可以确定加密方式为键盘加密,你真的低个头直接进行解密得到flag:

image-20240804205133631

考点:打开脑洞理解键盘加密

[SUCTF2018]single dog(新编码知识巩固题)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240804205608961

我们可以在结尾发现插入隐藏的rar文件,我们进行文件分离,解压出的1.txt中包含一大堆颜文字:

image-20240804205744351

因为是没见过的加密方式,所以我们启用万能的互联网:

image-20240804205815530

image-20240804205846834

解密出flag

考点:文件分离、学会用搜索引擎去搜索相关加密方式

黑客帝国(知识巩固题)

下载文件,发现里面是一份txt格式的文本:

image-20240804210046331

可以发现是数字和字母混合的字符串,里面的字母最大不超过“f”,说明是16进制的编码,我们进行解码:

image-20240804210158489

发现是rar文件,我们保存为.rar的格式文件,又加密了,我们进行密码爆破:

image-20240804210335202

解压后得到一张png格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240804210606718

我们可以发现文件内容含有“JFIF”字符串,应该是属于jpg图片格式的特征,而文件头却是png图片格式的,文件头格式错误我们进行修复(可以挪用正常的jpg图片的文件头):

image-20240804210736681

修复好的图片直接为我们展示了flag:

image-20240804210903372

考点:文件头修复

[SWPU2019]伟大的侦探(新密码知识巩固题)

下载文件,发现是一个加密了的zip压缩文件,而里面的“密码.txt”可以解压出来进行分析:

image-20240804211650307

我们可以使用010 editor中自带的一些编码方式尝试解码:

image-20240804211759634

最后我们发现使用EBCDIC编码方式时出现了压缩包的密码:

image-20240804211834267

解压文件,发现了一堆jpg格式的图片:

image-20240804211910559

我们上网搜索就能搜索出相关的加密方式:

image-20240804212004699

这样我们就可以对照相关的密码表进行解密得到flag了:

image-20240804212026533

考点:理解使用不同编码方式恢复乱码、学会用搜索引擎去搜索相关加密方式、耐心

[MRCTF2020]你能看懂音符吗(新密码知识巩固题)

下载文件,发现里面是一个rar的压缩包,尝试解压失败我们使用010 editor查看:

image-20240808000114257

文集那头除了问题,我们进行修复:

image-20240808000214075

提取出一个docx文件:

image-20240808000246437

里面是一堆音符,音符串结尾有等号我们猜测这不是正常的音乐而是一种加密方式,我们搜索相关加密方式:

image-20240808000511203

发现了相关的加解密工具,进行解密即可得到flag:

image-20240808000615205

考点:文件头修复、学会用搜索引擎去搜索相关加密方式

我吃三明治(新编码知识巩固题)

下载文件,发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240808000846266

发现文件尾部含有插入的疑似jpg图片的文件并且文件头含有隐藏信息

我们先对隐藏信息进行分析,字符串全部由大写字母与数字组成,数字出现的仅有2-5组成

Base32

Base32 是一种数据编码机制,使用 32 个可打印字符(字母 A-Z 和数字 2-7)对任意字节数据进行编码的方案,编码后的字符串不用区分大小写并排除了容易混淆的字符,可以方便地由人类使用并由计算机处理。

可以猜测并发现是base32编码内容,解码即可得到flag:

image-20240808002150473

考点:利用十六进制编辑器找到隐藏的信息、理解base32编码特征

[SWPU2019]你有没有好好看网课?(较难新编码新工具)

下载文件,发现里面是两个加密的zip的压缩包:

image-20240808002443128

flag2.zip没有任何密码提示,也没有伪加密的情况,我们先对flag3.zip继续分析

flag3.zip的注释中提示了密码,我们进行爆破:

image-20240808002849620

image-20240808002925777

解压出内容:

image-20240808003050865

我们打开flag.docx查看:

image-20240808003107782

没有隐藏的内容,我们推测这里的内容5.20和7.11会是一种提示,图片可能含有隐藏信息我们之后再进行分析

MP4文件的分析思路

1. 如果视频内容较短,优先使用Kinovea等工具逐帧查看所有内容寻找隐藏内容
2. 使用010editor分析插入隐藏信息
3. 使用了特定工具的MP4隐写

按照思路加上前面的提示内容,我们优先逐帧查看(尤其是5秒和7秒左右)“影流之主.mp4”查看是否含有隐藏信息:

image-20240808004713523

image-20240808004739149

发现画面中的灯上隐藏了信息:

..... ../... ./... ./... ../
dXBfdXBfdXA=

第一段我们可以判断为敲击码(在线解密工具:Tap code – Encode and decode online - cryptii),第二段是base64编码,我们进行解密:

image-20240808005251933

image-20240808005306915

组合起来的内容并不是flag,我们推测是flag2.zip的解压密码,解压成功

发现里面是一张jpg格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240808005437315

发现了插入隐藏的flag

考点:压缩包密码爆破、MP4文件的分析、理解敲击码、利用十六进制编辑器找到隐藏的信息

[ACTF新生赛2020]NTFS数据流(知识巩固题)

下载文件,发现里面是一个rar的压缩包,解压后爆了一大堆txt文件,内容都是一样的:

image-20240808005944346

按照题目提示,“NTFS数据流”说明flag.rar压缩包含有NTFS交换数据流隐藏数据,我们使用7z工具进行按照交替数据流方式排列查看:

image-20240808010129496

可以发现293.txt文件携带着附加的信息就是flag

考点:理解交替数据流隐藏文件

sqltest(较难知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240808010802291

按照数据包分析思路,我们先进行协议分级:

image-20240808010829885

发现HTTP协议发送的Line-base text data占比最多,我们优先过滤查看:

image-20240808011207767

HTTP数据包还是有很多,我们导出HTTP对象看看:

image-20240808011317863

可以发现攻击机一直在向index.php进行请求,看得出来是在使用GET请求修改URL来进行SQL注入

我们只好进行逐行分析,首先使用tshark进行导出更方便分析:

tshark -r sqltest.pcapng -Y "http.request" -T fields -e http.request.full_uri > data.txt

-r 读取文件
-Y 过滤语句
-T pdml|ps|text|fields|psml,设置解码结果输出的格式
-e 输出特定字段
http.request.full_uri http请求的uri部分

我们打开文件进行SQL注入过程的分析(为了方便分析,在此将所有%20替换为了空格):

(1~9行)获取information_schema.SCHEMATA中数据行数的长度,从中可以知道长度是1

image-20240811155854786

(10~18行)获取information_schema.SCHEMATA中数据行数chr(53) = '5'

即infomation_schema.SCHEMATA有5行数据
information_schema.SCHEMATA中保存了所有数据库,所以总共爆出5个数据库

image-20240811160046653

(1961行+6566行)获取每一个数据库的长度,这一部分是并发执行的
image-20240811160311043

image-20240811160546442

可以发现第一个数据库长度为18

​ 第二个数据库长度为3

​ 第三个数据库长度为7

​ 第四个数据库长度为4

​ 第五个数据库长度为5

(6264行+67417行)获取每一个数据库库名,并发执行
(418~426行)已经获取到了想要探测的库名“db_flag”,获取数据库information_schema.tables中数据行数的长度,从中可以知道长度是1
image-20240811160824616

(427~435行)获取information_schema.tables中数据行数chr(49) = '1',即infomation_schema.tables有1行数据
information_schema.tables中保存了所有数据表,所以在“db_flag”中总共爆出1个数据表
image-20240811161215222
(436~444行)获取数据表的长度,可以发现数据表的长度为7

image-20240811161331834

(445-510行)获取数据表表名
(511~519)已经获取到了想要探测的表名“tb_flag”,获取数据库information_schema.COLUMNS中数据行数的长度,从中可以知道长度是1
image-20240811161623600
(520~527行)获取information_schema.COLUMNS中数据行数chr(50) = '2'

即infomation_schema.COLUMNS有1行数据
information_schema.COLUMNS中保存了所有字段,所以在“db_flag”中总共爆出2个字段

image-20240811161735871

(528~545行)获取每一个字段的长度,这一部分是并发执行的
image-20240811162016497

可以发现第一个字段长度为2

​ 第二个字段长度为4

(546~601行)获取每一个字段名,并发执行

(602~610行)已经获取到了想要探测的字段,获取db_flag.tb_flag中数据行数的长度,从中可以知道长度是1
image-20240811162428992
(611~619行)获取db_flag.tb_flag中数据行数chr(49) = '1'

即db_flag.tb_flag有1行数据
db_flag.tb_flag中保存了所有数据,所以在“db_flag”中总共爆出1个数据

image-20240811162811940

(620~627行)获取数据的长度,可以发现数据的长度为38

image-20240811162921709

(628-972行)获取数据值
这一步就是我们要找的flag了,我们可以逐一手动提取,也可以写一个脚本提取一下。

(以下脚本来源于:BUU 流量分析 sqltest - 云千 - 博客园 (cnblogs.com)

我们知道注入语句为

id=1 and ascii(substr(((select concat_ws(char(94), flag)  from db_flag.tb_flag  limit 0,1)), {第i个字符}, 1))>{字符的ascii值}

我们把第i个字符ascii值提取出来,取i变化时的值,脚本为:

import urllib.parse		#导入 urllib.parse 模块,用于解码 URL 编码的字符串
f = open("data.txt","r").readlines()		#打开 data.txt 文件并读取其中的所有行。f 是一个列表,每一行数据作为一个元素存储在列表中。

s = []		#初始化一个空列表 s,用于存储解析后的数据。
for i in range(627,972):
    data = urllib.parse.unquote(f[i]).strip()		#对从文件读取的一行数据进行 URL 解码,strip()用于去除两端的空白字符。
    payload = data.split("and")[1]		#通过 split("and") 方法获取 "and" 后面的部分。
    positions = payload.find("from db_flag.tb_flag  limit 0,1)), ")		#寻找特定字符串 "from db_flag.tb_flag limit 0,1)), " 在 payload 中的位置。
    data1 = payload[positions+35:].split(",")[0]		#从 positions+35 位置开始提取数据,并在第一个逗号前截断,提取出一个表示数据位置或长度的值。
    data2 = payload[positions+35:].split(">")[1]		#从 positions+35 位置开始提取数据,并在 > 符号后截断,提取出一个 ASCII 码值。
    s.append([data1,data2])		#将 data1 和 data2 作为一个列表,追加到 s 列表中。

for i in range(1,len(s)):
    if s[i][0]!=s[i-1][0]:
        print(chr(int(s[i-1][1])),end="")
print(chr(int(s[-1][1])))
#循环输出还原消息

输出得到flag

考点:SQL注入流量分析

john-in-the-middle(较难知识巩固题)

下载文件,发现里面是一个pcap格式的文件,我们使用wireshark打开查看:

image-20240811164401166

按照数据包分析思路,我们先进行协议分级:

image-20240811164544434

发现HTTP协议发送的Media Type占比最多,媒体文件我们尝试导出对象查看:

image-20240811165110074

我们优先分析图片,使用010editor逐一查看没有发现不对劲的,我们开始使用stegsolve,发现了scanlines.png图片文件在很多通道中会显示一条线:

image-20240811165320028

但在logo.png的一个通道中显示出了flag:

image-20240811165448790

补充:StegSolve功能六——图像拼接

上网查了其他人的wp,发现在此应该使用Stegsolve的图像组合

image-20240811170022089

发现logo.png有一条很可疑的直线,我们将它与scanlines.png进行图像拼接:

image-20240811170205622

image-20240811170217215

考点:提取流量包中的文件、LSB隐写(?)

[ACTF新生赛2020]swp(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240811175857018

按照数据包分析思路,我们先进行协议分级:

image-20240811180007940

发现HTTP协议占比最多,看了下好像是有在文件传输,我们尝试导出对象查看:

image-20240811182736699

值得注意的有secret.zip和hint.html(提示)文件,zip文件加密了我们先打开提示看看:

image-20240811182830894

已经是明示zip存在伪加密了,我们进行修改解压即可在flag.swp文件中找到flag:

image-20240811182939558

考点:提取流量包中的文件、寻找导出对象重点文件、理解zip伪加密原理

[UTCTF2020]docx(知识巩固题)

下载文件,发现里面是一个docx格式的表格文件,我们点击查看:

image-20240811183536529

没发现藏着什么东西,因为如今的office办公软件的输出文件其实都是一个压缩包,包含着文件的xml文件、图片、视频等所有素材,我们将文件后缀改为.zip后打开查看找到了flag:

image-20240811183730514

考点:理解office文件是一堆文件的压缩文件

[GXYCTF2019]SXMgdGhpcyBiYXNlPw==(知识巩固题)

下载文件,发现里面是一份txt格式的文本:

image-20240812171710824

我们可以看到一串串的base64编码内容,我们可以判断这里存在base64隐写

在此我使用puzzlesolver自动进行base64隐写的解密:

image-20240814150741272

考点:理解base64隐写

间谍启示录(新)

下载文件,发现里面是一个iso格式的文件:

image-20240814151931276

ISO文件格式简介

带有 .iso 扩展名的文件是未压缩的存档磁盘映像文件,它代表光盘(如 CD 或 DVD)上的全部数据内容。基于 ISO-9660标准,ISO 映像文件格式包含光盘数据以及存储在其中的文件系统信息。 ISO 文件包含内容的精确副本的能力使其成为创建 CD/DVD 副本的完美文件类型,并且主要用于存储可引导数据以进行安装。大多数时候,ISO 文件被刻录到 USB/CD/DVD 作为可引导内容,用于引导机器进行安装。 ISO 文件的 MIME 类型为 application/x-iso9660-image。

映像文件中的内容各种各样,我们需要分情况分析,但首先我们用7z工具查看其中的内容:

image-20240814152816757

我们进行解压,大部分是空文件,还有一个类似提示的说明:

image-20240814152853130

我们尝试运行exe文件:

image-20240814152923620

image-20240814152934379

我们可以发现它是一个自解压程序,貌似我们尝试获取机密时身份识别立刻生效将文件销毁了。

自解压程序简介

一个 SFX (SelF-eXtracting)自解压文件是压缩文件的一种,因为它可以不用借助任何压缩工具,而只需双击该文件就可以自动执行解压缩,因此叫做自解压文件。同压缩文件相比,自解压的压缩文件体积要大于普通的压缩文件(因为它内置了自解压程序),但它的优点就是可以在没有安装压缩软件的情况下打开压缩文件(文件类型为·exe格式)。

参考文章(https://blog.csdn.net/d_chunyu/article/details/103270353)

我们将该exe文件使用7z当做压缩包打开观察里面包含的内容:

image-20240814153437213

我们可以推测我们尝试获取机密时运行的是“flag.exe”文件,但很快接着运行了“文件已被销毁.exe”文件,我们将“systemzx.exe”进行解压并运行“flag.txt”即可得到flag机密文件:

image-20240814153652376

注意:这机密文件还是隐藏的,我们需要开启查看隐藏文件的选项才能看到:

image-20240814153734330

补充:另一种思路

看到了不认识的后缀文件,我们使用010 editor打开,被模板解析后没有发现插入隐藏的文件,我们直接搜索文本“flag”:

image-20240814154017413

发现了其中藏着的“flag.exe”,手动提取看似非常困难,我们使用工具自动提取:

binwalk -e 38f7b8b3-de57-4f93-a23e-f17ecf97835c.iso 

image-20240814155121577

貌似无法分解,我们尝试使用foremost:

foremost 38f7b8b3-de57-4f93-a23e-f17ecf97835c.iso 

image-20240814155822663

我们发现foremost按照文件格式分解出了很多文件,我们一个个分析:

exe文件夹中自解压程序强行提取被损坏了

image-20240814160241065

ole文件是看不懂的格式,先跳过

rar文件包含了“flag.exe”,运行即可得到flag

考点:理解iso文件格式、理解自解压程序

喵喵喵(较难知识巩固题)

下载文件,发现里面是一张png格式的图片

按照图片隐写思路,第一步无果,第二步也无果,我们优先使用stegsolve打开图片查看:

image-20240814161245140

image-20240814161256466

image-20240814161309223

我们可以发现,当我们关闭红色通道(red plane 0)、绿色通道或是蓝色通道时,图片的上方出现了黑白的印记,很显然是二进制的信息,我们继续使用StegSolve进行分析:

image-20240814161631247

Red plane 0含有隐藏信息

Green plane 0含有隐藏信息

Blue plane 0含有隐藏信息

Extract By 我们发现图片上方在关闭通道出现黑白的印记是横向的,因此按row(行)提取像素而不是column(列)

Bit Order 我们知道像素值是按最低位的修改进行隐写的,因此选LSB(像素值最低位作为第一位)

Bit Plane Order 设置RGB通道的顺序,默认RGB,多次尝试发现正确的排列顺序是BGR才会出现正确的隐藏信息

我们发现隐藏信息是一张png图片文件,我们点击Save Bin,将图片保存为.png格式的文件,发现打不开:

image-20240814161724536

这里不知道为什么010 editor不能打开进行分析了(软件抽风),所以这里介绍另一种方法

我们点击Save Text保存保存输出,用Notepad++打开:

image-20240814162928779

我们发现输出很奇怪,但没关系,我们按住alt键进行按列复制:

image-20240814163058622

复制的内容放到cyberchef去掉换行符并进行十六进制编码:

image-20240814163212846

我们将输出保存为png格式的图片发现010 editor还是打不开,那我们直接将十六进制格式的输出复制到010 editor里面(shift+ctrl+v):

image-20240814163442590

image-20240814163449581

修复文件头后即可打开图片:

image-20240814163557471

可以发现是半张二维码,可以猜测这里存在PNG宽高隐写,我们使用脚本进行爆破:

image-20240814163659094

修改宽高值,扫描二维码即可得到flag.rar的网盘下载地址,我们进行下载:

image-20240814164043689

txt文件隐藏的信息思路

1.观察txt文件的属性说不定会有线索

2.txt文件里面是一堆空行可能存在snow隐写

3.存在NTFS隐写

观察文件属性也没有备注消息,我们猜测这里存在NTFS文件隐写,我们使用7z打开flag.rar却没发现交替数据流的信息,这里我们要使用专业的软件来查看NTFS文件隐写的软件:NtfsStreamsEditor

NTFS流隐写得用WinRAR解压(这里我也不清楚原理),解压后观察flag.txt的NTFS隐写流

image-20240814165832103

发现了隐藏了flag.pyc文件,pyc 文件是 Python 编译后的字节码文件,可以提高运行速度,但也有一定的限制。在此我们应该先把pyc文件反编译回python源码,这里可以利用在线工具网站python反编译 - 在线工具 (tool.lu)进行反编译:

image-20240814170235347

#!/usr/bin/env python
# visit https://tool.lu/pyc/ for more information
# Version: Python 2.7

import base64

def encode():
    flag = '*************'
    ciphertext = []
    for i in range(len(flag)):
        s = chr(i ^ ord(flag[i]))
        if i % 2 == 0:
            s = ord(s) + 10
        else:
            s = ord(s) - 10
        ciphertext.append(str(s))
    
    return ciphertext[::-1]

ciphertext = [
    '96',
    '65',
    '93',
    '123',
    '91',
    '97',
    '22',
    '93',
    '70',
    '102',
    '94',
    '132',
    '46',
    '112',
    '64',
    '97',
    '88',
    '80',
    '82',
    '137',
    '90',
    '109',
    '99',
    '112']

我们分析源码,发现flag的内容经过了加密,但给我们输出了密文

def encode():
    flag = '*************'
    ciphertext = []
    for i in range(len(flag)):
        s = chr(i ^ ord(flag[i]))
        if i % 2 == 0:
            s = ord(s) + 10
        else:
            s = ord(s) - 10
        ciphertext.append(str(s))
    
    return ciphertext[::-1]

遍历字符串

for i in range(len(flag)):
    s = chr(i ^ ord(flag[i]))

这个循环遍历了字符串 flag 的每一个字符。对于每个字符,首先将字符的ASCII值(使用ord()函数)与当前位置的索引值 i 进行按位异或操作,然后将结果转换为一个字符(使用chr()函数)。

根据索引的奇偶性调整ASCII值

if i % 2 == 0:
    s = ord(s) + 10
else:
    s = ord(s) - 10

如果索引 i 是偶数,调整后的字符的ASCII值增加10;如果是奇数,ASCII值减少10。

生成密文

ciphertext.append(str(s))

将转换后的字符的ASCII值(转换为字符串形式)添加到ciphertext列表中。

列表反转

return ciphertext[::-1]

在返回最终的密文列表之前,列表被反转。

在此我们得编码写出解密脚本:

def decode(ciphertext):
    # 反转密文列表
    ciphertext = ciphertext[::-1]
    flag = []
    
    for i in range(len(ciphertext)):
        s = int(ciphertext[i])
        
        # 根据索引的奇偶性进行逆操作
        if i % 2 == 0:
            s -= 10
        else:
            s += 10
        
        # 进行逆向的按位异或操作
        original_char = chr(i ^ s)
        flag.append(original_char)
    
    # 将列表中的字符拼接成字符串
    return ''.join(flag)

ciphertext = [
    '96', '65', '93', '123', '91', '97', '22', '93', '70', '102', 
    '94', '132', '46', '112', '64', '97', '88', '80', '82', '137', 
    '90', '109', '99', '112'
]

# 解密得到的flag
flag = decode(ciphertext)
print("解密后的flag是:", flag)

得到flag

image-20240814171012323

考点:理解LSB隐写原理、学会利用工具、文件头修复、PNG宽高隐写、理解爆破PNG宽高原理、理解NTFS流隐写隐藏文件、pyc文件反编译、逆向解密脚本编写

小易的U盘(新)

下载文件,发现里面是一个iso格式的文件。首先我们用7z工具查看其中的内容:

image-20240814171851545

我们找到了flag.txt,打开查看:

image-20240814171937268

这里提示flag还没生成,我们按照提示应该注意可以生成flag的程序,就是上方一堆autoflag.exe的副本

最下方还有个autorun.inf文件,我们查看其中内容:

image-20240814172154722

inf文件格式简介

inf 文件是 Windows 系统中非常重要的配置文件,主要用于驱动程序安装和设备配置。它们以结构化的方式包含了安装过程的所有指令,使得操作系统能够正确安装和配置硬件设备。

[AutoRun] 这个节通常用于指定在某个特定条件下自动运行的命令或程序

Open 这一行指示系统在特定情况下自动运行指定的程序或命令

我们可以推测autoflag - 副本 (32)是正确生成flag的程序我们尝试运行:

image-20240814175141666

要分析exe文件我们要使用反编译软件——IDA

IDA简介

IDA是一个反编译器,同时具备调试器的功能。功能非常强大,几乎所有的逆向题目都需要用到它。

我们使用IDA进行分析:

image-20240814175656446

看不懂?没事,这是misc方向的题目而不是reserve方向的题目,因此我们直接搜索字符串

按下shift+F12可以查看exe中的字符串,找到了flag

image-20240814175748269

我们也可以按下F5进行反编译查看源码,可以推测报错的原因是找不到flag.txt文件:

image-20240814180051825

考点:理解iso文件格式、会使用IDA打开文件查找字符串

[RoarCTF2019]黄金6年

下载文件,发现里面是一个mp4格式的视频。

按照思路,我们优先逐帧查看视频是否含有隐藏信息,发现了一闪而过的二维码:

image-20240814180752351

image-20240814180823936

有key2,那就有key1,我们仔细寻找:

image-20240814181125153

image-20240814181143043

image-20240814181332561

image-20240814181351505

image-20240814181452576

image-20240814181520775

我们尝试将key作为flag上交,发现不是。

按照思路,我们应该继续对mp4文件进行分析。

MP4文件格式简介

MP4文件中的所有数据都装在box(QuickTime中为atom)中,也就是说MP4文件由若干个box组成,每个box有类型和长度,可以将box理解为一个数据对象块。box中可以包含另一个box,这种box称为container box。一个MP4文件首先会有且只有一个“ftyp”类型的box,作为MP4格式的标志并包含关于文件的一些信息;之后会有且只有一个“moov”类型的box(Movie Box),它是一种container box,子box包含了媒体的metadata信息;MP4文件的媒体数据包含在“mdat”类型的box(Midia Data Box)中,该类型的box也是container box,可以有多个,也可以没有(当媒体数据全部引用其他文件时),媒体数据的结构由metadata进行描述。

参考文章:https://blog.csdn.net/qq_45186086/article/details/110499149

我们用010 editor打开:

image-20240814182445209

可以发现除了上述的5中box最底下还出现了奇怪的box,我们分析发现这是base64编码后的内容,我们使用cyberchef进行解码:

image-20240814182201375

发现是rar文件,我们进行保存,发现需要密码,我们推测密码就是前面解出来的key:iwantplayctf

解压即可得到flag

考点:MP4文件的分析、利用十六进制编辑器找到隐藏的信息

[WUSTCTF2020]alison_likes_jojo(新工具)

下载文件,发现里面是两张jpg格式的图片,我们先对第一张进行分析
按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:
Pasted image 20240815164936
我们可以在结尾发现插入隐藏的zip文件,我们进行文件分离,发现它加密了,并且不存在伪加密的情况,我们只好进行爆破:
Pasted image 20240815170134
我们解压文件,发现了“beisi.txt”文件,里面的内容我们可以使用cyberchef进行自动解密(我们也可以看出文件名提示我们这是base加密):
Pasted image 20240815170357
我们开始对第二张图片进行分析
按照图片隐写思路,第一步、第二步、第三步、第四步无果,我们可以推测这是使用了特殊的隐写工具进行的隐写,并且上一步得到的字符串“killerqueen”极有可能是隐写的密码
按照特殊隐写工具的使用顺序,我们先使用最广泛使用的steghide

steghide extract -sf jljy.jpg -p killerqueen

Pasted image 20240815171155
发现并没有使用steghide
我们使用下一个工具——outguess

Outguess——第二使用的jpeg特定图片隐写工具

outguess -k killerqueen -r jljy.jpg -t 1.txt

-k 指定密码
-r 指定图片文件
-t 指定输出文件
我们可以发现隐藏的flag
Pasted image 20240815171739
考点:文件分离、压缩包密码爆破、使用了特定工具进行的图片文件隐写

[安洵杯 2019]吹着贝斯扫二维码(新)

下载文件,发现里面是一堆没有后缀名的文件以及加密的flag.zip,(没有伪加密的情况)我们从flag.zip的备注中发现了信息:
Pasted image 20240815172951

对没有后缀的文件我们先用010 editor打开进行分析,发现是jpg图片文件:
Pasted image 20240815174829
同时我们可以发现文件尾的后边有插入的数字,我们可以推测这存在着一定的规律:
Pasted image 20240815175954
我们可以在当前目录下使用命令提示符给所有文件加上.jpg的后缀:

ren * *.jpg

ren 重命名文件

注意:此时flag.zip的后缀也被改为.jpg了,我们应该改回.zip后缀
Pasted image 20240815175642
我们可以发现图片都是零散的二维码碎片,我们应该用图片编辑软件进行拼图(这里我使用的是GIMP),我们可以先从二维码的左上、右上、左下、三个定位点开始,结合之前得到每个图片文件尾出现的数字,我们可以编写一个脚本,实现将所有图片最后两位字节提取出来并且作为图片的文件名方便我们拼图:

import os
from PIL import Image

#目录路径
dir_name = r"./"
#获取目录下文件名列表
dir_list = os.listdir('./')
#print(dir_list)

#从列表中依次读取文件
for file in dir_list:
    if '.jpg' in file:
        f=open(file ,'rb')
        n1 = str(f.read())
        n2 = n1[-3:]	
        #经过测试发现这里要读取最后3个字节,因为最后还有一个多余的字节,不知道是不是转字符串的原因导致在末尾多了一个字符
        #print(file) #输出文件内容
        #print(n2)
        f.close()	#先关闭文件才能重命名,否则会报`文件被占用`错误
        os.rename(file,n2+'.jpg')	#重命名文件

引用文章:https://blog.csdn.net/m0_46631007/article/details/119965593
按照顺序进行排列(使用GIMP的标尺工具):
Pasted image 20240815190709
我们扫描二维码,得到了以下内容:

Pasted image 20240815190821
我们可以推测这是压缩包中备注的编码过程,我们进行逆向解码(数字85代表base85,64代表base64,13代表ROT13,16代表HEX,这里需要大家对数字代表的编码有一定程度的敏感):
Pasted image 20240815191249
出现字符串,我们推测这是zip文件的解压密码,我们进行解压得到flag
考点:二维码图片拼接、对数字代表的编码有一定程度的敏感

弱口令(较难新工具)

下载文件,发现是一个加密的压缩包
按照遇到含有密码的压缩包思路,我们首先注意观察压缩包是否有备注:

Pasted image 20240815191951

这是纯由空格和tab键组成的空白内容,这种可能是摩斯电码或者是snow隐写,我们先尝试摩斯电码,将空格转换成“.”,tab转换成“-”:
Pasted image 20240815193151
解压文件得到一张png格式的图片
这道题目密码的提示并不全面,并不是一道好题目,以下分析均来源于其他人的WP
使用密钥123456,对应题目“弱口令”。
按照png图片特殊隐写工具的使用顺序,我们先使用最广泛应用的脚本zsteg

Zsteg——第一使用的png特定图片隐写工具

zsteg 女神.png -a -v

-a 对所有信道所有可能进行全方面扫描
-v 提取出有效数据并显示出来
Pasted image 20240815205339
发现并没有使用zsteg
我们使用下一个工具——cloacked-pixel

Cloacked-pixel——第二使用的png特定图片隐写工具

下载地址

GitHub - livz/cloacked-pixel: LSB steganography and detection

python2 lsb.py extract 女神.png 1.txt 123456

Pasted image 20240815213015
得到flag
考点:注意观察压缩包是否有备注、使用了特定工具进行的图片文件隐写

从娃娃抓起(新)

下载文件发现里面是两个txt文件,一个进行了提示:
Pasted image 20240816091753
密文:
Pasted image 20240816091826
这里考察了我们对中国电子信息发展历史的了解或编码的眼界,我们按照提示可以看出第一段是中文电码,第二段是五笔输入法的输入

中文电码

中文电码,又称中文商用电码、中文电报码或中文电报明码,原本是于电报之中传送中文信息的方法。它是第一个把汉字化作电子讯号的编码表。
自摩尔斯电码在1835年发明后,一直只能用来传送英语或以拉丁字母拼写的文字。1873年,法国驻华人员威基杰(S·A·Viguer)参照《康熙字典》的部首排列方法,挑选了常用汉字6800多个,编成了第一部汉字电码本,名为《电报新书》。后由我国的郑观应将其改编成为《中国电报新编》。这是中国最早的汉字电码本。中国人最早研制的电报机华侨商人王承荣从法国回国后,与福州的王斌研制出我国第一台电报机,并呈请政府自办电报。清政府拒不采纳。
在此我们使用在线网站进行解密
Pasted image 20240816092538

五笔输入法

五笔字型输入法(简称:五笔)是王永民在1983年8月发明的一种汉字输入法。开创了汉字输入能直接用标准键盘,可以像西文一样方便快捷“盲打”输入的新纪元,避免了中国计算机产业(PC)的“畸形”。因为发明人姓王,所以也称为“王码五笔。五笔字型完全依据笔画和字形特征对汉字进行编码,是典型的形码输入法。
在此我们使用搜狗五笔输入法进行输入:
Pasted image 20240816093052
按照提示,我们使用cyberchef将“人工智能也要从娃娃抓起”这句话转为md5,得到flag
Pasted image 20240816093307
考点:理解中文编码、理解五笔输入法、理解其对中国汉字信息化的意义

Mysterious(较难)

下载文件,发现里面是一个exe格式的文件,我们运行会让我们输入密码:
Pasted image 20240816093724
我们使用IDA进行打开,IDA的系统介绍将会放在reverse专题,这里不多做介绍
按照misc方向的逆向思路,我们优先查看字符串(shift+F12):
Pasted image 20240816094556
可以发现“well done”的字符串,我们双击可以跳转到其地址:

Pasted image 20240816094746
我们可以看出包含这些字符串的函数名称,我们双击跳转:
Pasted image 20240816094908
可以发现我们跳转到了这个函数底下,显示的是该函数的汇编代码,我们按下F5进行反编译即可得到伪C代码:

int __stdcall DialogFunc_0(HWND hWnd, int a2, int a3, int a4)
{
  int v4; // eax
  char Source[260]; // [esp+50h] [ebp-310h] BYREF
  _BYTE Text[257]; // [esp+154h] [ebp-20Ch] BYREF
  __int16 v8; // [esp+255h] [ebp-10Bh]
  char v9; // [esp+257h] [ebp-109h]
  int Value; // [esp+258h] [ebp-108h]
  CHAR String[260]; // [esp+25Ch] [ebp-104h] BYREF

  memset(String, 0, sizeof(String));
  Value = 0;
  if ( a2 == 16 )  // 如果接收到 WM_CLOSE 消息
  {
    DestroyWindow(hWnd);  // 销毁窗口
    PostQuitMessage(0);  // 结束消息循环
  }
  else if ( a2 == 273 )  // 如果接收到 WM_COMMAND 消息
  {
    if ( a3 == 1000 )  // 如果控件ID是1000(按钮或其他控件)
    {
      GetDlgItemTextA(hWnd, 1002, String, 260);  // 从控件ID为1002的文本框获取输入字符串
      strlen(String);  // 计算字符串长度
      if ( strlen(String) > 6 )  // 如果字符串长度大于6
        ExitProcess(0);  // 退出程序
      v4 = atoi(String);  // 将字符串转换为整数
      Value = v4 + 1;  // 将整数值加1
      if ( v4 == 122 && String[3] == 120 && String[5] == 122 && String[4] == 121 )
      {
        strcpy(Text, "flag");  // 将 "flag" 复制到Text数组
        memset(&Text[5], 0, 0xFCu);  // 将 Text[5] 之后的内容清零
        v8 = 0;
        v9 = 0;
        _itoa(Value, Source, 10);  // 将 Value 转换为字符串并存储在 Source
        strcat(Text, "{");  // 将 "{" 添加到 Text 末尾
        strcat(Text, Source);  // 将 Value 的字符串形式添加到 Text
        strcat(Text, "_");  // 将 "_" 添加到 Text
        strcat(Text, "Buff3r_0v3rf|0w");  // 将 "Buff3r_0v3rf|0w" 添加到 Text
        strcat(Text, "}");  // 将 "}" 添加到 Text
        MessageBoxA(0, Text, "well done", 0);  // 显示消息框,内容为 Text
      }
      SetTimer(hWnd, 1u, 0x3E8u, TimerFunc);  // 设置一个1秒的定时器
    }
    if ( a3 == 1001 )  // 如果控件ID是1001
      KillTimer(hWnd, 1u);  // 停止定时器
  }
  return 0;
}

我们可以看出题目对我们输入的字符串要求是“长度小于等于6”、“字符串转换为整数后为122”、“字符串的第4位转换ascii码值为120即字符串第4位为x”、“字符串的第6位转换ascii码值为122即字符串第6位为z”、“字符串的第5位转换ascii码值为122即字符串第5位为y”(字符串第1位为string[0])

那么我们可以得出当我们输入的字符串为“122xyz”时,程序会将我们输入的字符串转换为整数+1的值与“_Buff3r_0v3rf|0w”结合起来形成的flag,即“123_Buff3r_0v3rf|0w”
Pasted image 20240816100945
我们得到了flag
考点:IDA的使用、程序分析

[GUET-CTF2019]zips(新)

下载文件,发现是一个加密的压缩包
按照遇到含有密码的压缩包思路,第一步、第二步无果,我们只好进行爆破:
Pasted image 20240816101829
解压后,里面又是一个加密的压缩包
按照遇到含有密码的压缩包思路,第一步无果,第二步我们发现了伪加密的情况,我们进行修改:
Pasted image 20240816102200
解压文件,发现了加密的zip文件和.sh文件:
Pasted image 20240816102316

.sh和.bat文件

两者都属于shell脚本,用于在计算机上使用命令。
二者的区别源于使用对象不同,bat主要是运行在Windows 的shell脚本完成一系列的项目文件集合启动,集成多项依赖加载执行;sh 脚本是运行在Unix系统的shell脚本,方便部署应用。
我们使用任意文本编辑器都可以查看.sh的内容,我们查看:

#!/bin/bash
#
zip -e --password=`python -c "print(__import__('time').time())"` flag.zip flag

zip -e:
- -e 选项表示创建加密的ZIP文件。生成的ZIP文件会要求输入密码才能解压缩。
--password=:
- 这个选项用于指定ZIP文件的密码。密码通过反引号(`...`)中的命令动态生成。
反引号中的Python命令:
- python -c "print(__import__('time').time())":这是一个内联Python命令。
- python -c "..." 允许你在命令行中直接运行Python代码。
- __import__('time').time() 调用了Python的time模块,并获取当前时间的时间戳

时间戳

我们需要知道,时间是不断流逝的,简单地说时间戳在计算机里面表示时间的每一刻,是一串不断随时间流逝增长的数字,每度过一个时刻时间戳就会进行增长(一般按秒增长)
也就是说目前的计算机所能记录的极限时间戳为999999999999,即到了33658-09-27 09:46:39(北京时间)这一刻计算机的时间戳将会归零回归到1970-01-01 08:00:00(北京时间)
我们知道了zip压缩包的密码是其创建时的时间戳,我们使用查看文件属性并进行转换即可:
Pasted image 20240816103929
密码错误,可能存在相关时差,但最多也不会超过一年,因此我们以“15”开头,爆破剩下8位数字,我们可以进行纯数字掩码爆破:

还是爆破不出来,我们推测可能是按毫秒的时间戳,我们按照毫秒时间戳格式来(此时掩码应该减少几位):
Pasted image 20240816123930
还是解不出来,我们推测是python输出的时间戳与在线转换的不同,我们观察:
Pasted image 20240816124117
后边有这么多位!爆破需要60分钟左右,直接否定了这个方法
还是没有结果,我们可以推测不同版本的python的输出不同,我们使用python2输出时间戳:

可以发现后边只输出了两位数字,我们进行爆破得到了正确密码
Pasted image 20240816125041
解压文件,得到flag
考点:压缩包爆破、压缩包伪加密、理解时间戳的概念、跳转思路

zip(新)

下载文件,里面是一堆加密的zip压缩文件,并且内部只有一个很小的txt文件:
Pasted image 20240816150605
每个文件大小都只有4bit,这里我们可以考虑CRC爆破的情况

CRC爆破

CRC的全称是循环冗余校验,不同长度的常数对应着不同的CRC实现算法,CRC32表示会产生一个32bit(8位十六进制)的校验值。在产生CRC32时,源数据块的每一位都参与了运算,因此即使数据块中只有一位发生改变也会得到不同的CRC32值,利用这个原理我们可以直接爆破出加密文件的内容。由于CPU能力,CRC碰撞只能用于压缩文件较小的情况。
我们使用以下python2脚本(来源于CTF解题技能之压缩包分析进阶篇 - FreeBuf网络安全行业门户):

#coding:utf-8

import zipfile
import string
import binascii

def CrackCrc(crc):
    for i in dic:
        for j in dic:
            for p in dic:
                for q in dic:
                    s = i + j + p + q
                    if crc == (binascii.crc32(s) & 0xffffffff):
                        # 在 Python 2.x 中,binascii.crc32 的结果是有符号整数,为了与CRC32的无符号整数比较,需要 & 0xffffffff
                        f.write(s)
                        return

def CrackZip():
    for I in range(68):
        file = 'out' + str(I) + '.zip'
        f = zipfile.ZipFile(file, 'r')
        GetCrc = f.getinfo('data.txt')
        crc = GetCrc.CRC  # 获取 ZIP 文件中 data.txt 文件的 CRC32 值
        CrackCrc(crc)

dic = string.ascii_letters + string.digits + '+/='
# dic 包含所有可能的字符,包括大小写字母、数字以及 '+/='

f = open('out.txt', 'w')

CrackZip()

f.close()

主要功能

  1. CrackCrc(crc):
    • 这是一个暴力破解函数,遍历dic中的所有可能字符组合,尝试找到与输入的CRC32值相匹配的4字符字符串。(因为每个压缩包中的内容只有4bit大小,因此只包含4字符的循环碰撞)
    • s = i + j + p + q:拼接4个字符,生成一个4字符字符串。
    • binascii.crc32(s) & 0xffffffff:计算字符串的CRC32值,并与目标CRC32值(crc)比较。
    • 如果找到匹配的字符串,立即写入out.txt文件,并终止函数。
  2. CrackZip():
    • 这个函数负责遍历68个ZIP文件(因为它们名为out0.zipout67.zip),并从每个文件中提取data.txt文件的CRC32值。
    • 然后,它调用CrackCrc(crc)函数来尝试破解该CRC32值。
  3. dic:
    • 包含了所有可能的字符,用于生成4字符的排列组合。字符集包括:
      • 所有大小写英文字母:abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ
      • 数字:0123456789
      • 特殊字符:+/=
  4. 文件操作:
    • out.txt 文件用于存储找到的匹配字符串。
      脚本输出的out.txt内容经base64编码,我们进行解码可以得到奇怪的内容:
      Pasted image 20240816153904
      我们保存输出后使用010 editor打开分析:
      Pasted image 20240816154106
      貌似是文件头确实,我们可以根据文件尾分析这是什么文件
      没有经验的同学们可以将文件尾拿去搜索,看看是什么文件的文件尾:
      Pasted image 20240816154302
      那么可以确定是rar文件了,我们进行文件头修复即可:
      Pasted image 20240816154730
      解压后还是没有得到flag:
      Pasted image 20240816154755
      我们重新开始分析构造的rar文件,发现在他的备注里面藏着flag:
      Pasted image 20240816154857
      考点:CRC爆破、文件头修复、注意观察压缩包是否有备注

[UTCTF2020]file header(知识巩固题)

下载文件,是一个打不开的png格式,按照题目提示修复该文件的文件头直接得到了flag:
Pasted image 20240816155507
考点:文件头修复

[XMAN2018排位赛]通行证(知识巩固题)

一段文字,一眼base64,进行解码:
Pasted image 20240816155704
发现顺序不正确,这种调换顺序的密码让人想要尝试栅栏密码(发现解密的方式不行,那就加密出现flag的格式):
Pasted image 20240816160222
尝试上交,发现不是flag
flag的内容并不通顺,我们猜测是存在替换式密码,优先使用ROT13尝试解密,发现了正确的flag:
Pasted image 20240816160412
考点:对相关密码的敏感(可以参考https://www.cnblogs.com/handsomexuejian/p/18305321)

[WUSTCTF2020]girlfriend(新工具)

下载文件,发现里面是一个wav格式的音频文件
播放音频,发现是电话拨号音

DTMF拨号音

DTMF拨号音在拨打电话时,用于发送拨号信息。每按一个数字键,电话会发出一个特定的双音调组合,通过电话线路传送到交换机,交换机接收到这些音调后,可以识别出用户所拨的号码,并将呼叫路由到目标电话。
通过电话拨号,用户可以向远程设备发送DTMF信号,控制设备的开关、调整设置等。例如,早期的一些家用自动化系统、报警系统等可以通过电话的DTMF信号进行远程控制。
每个按键对应两个特定频率的音调组合,一个来自低频组,一个来自高频组。由于每个按键产生独特的音调组合,因此可以精确传递按键信息。

如果是拨号音,那么我们就可以使用相关工具进行分析——dtmf2num.exe

dtmf2num

一款可以将dtmf拨号音转换成数字的软件
下载后我们使用以下命令:

dtmf2num.exe girlfriend.wav

Pasted image 20240816162657
解出了数字999 666 88 2 777 33 6 999 4 444 777 555 333 777 444 33 66 3 7777
补充:网上也发现了使用python相关库识别的脚本:

import scipy.io.wavefile as wav
import scipy.fftpack as fft
 
# 读取音频文件
fs, data = wav.read('dtmf.wav')
# 计算帧长
frame_length = int(fs * 0.01)  # 10ms
# 分帧
frames = []
for i in range(0, len(data), frame_length):
    frame = data[i:i+frame_length]
    frames.append(frame)
# 识别拨号音
for frame in frames:
    # 计算 FFT
    fft_result = fft.fft(frame)
    # 计算频率分量
    frequencies = fft.fftfreq(len(fft_result)) * fs
    # 计算振幅分量
    amplitudes = abs(fft_result)
    # 找到最大振幅对应的频率
    max_amplitude_index = amplitudes.argmax()
    max_frequency = frequencies[max_amplitude_index]
    # 根据频率判断是哪个拨号音
    if max_frequency in (697, 770):
        print('拨号音:1')
    elif max_frequency in (697, 770, 852, 941):
        print('拨号音:2')
    elif max_frequency in (770, 852):
        print('拨号音:3')
    elif max_frequency in (770, 852, 941, 1209):
        print('拨号音:4')
    elif max_frequency in (770, 941):
        print('拨号音:5')
    elif max_frequency in (852, 941, 1209, 1336):
        print('拨号音:6')
    elif max_frequency in (941, 1209):
        print('拨号音:7')
    elif max_frequency in (697, 770,852,941,1209,1336):
        print('拨号音:8')
    elif max_frequency in (770, 852, 941, 1209, 1336):
        print('拨号音:9')
    elif max_frequency in (941):
        print('拨号音:*')
    elif max_frequency in (941, 1336):
        print('拨号音:0')
	elif max_frequency in (941, 1209, 1336):
        print('拨号音:#')

这里也需要大家平时的积累或是联想能力了,这些数字与拨号按键有关,那么与拨号按键有关的就是九键输入的方式了:
Pasted image 20240816162909
以前用按键手机的时候就是按下几次数字就会出现相应数字的第几个字母,因此解密可以出来YOUREMYGIRLFRIENDS,即为flag
考点:理解DTMF拨号音、能够联想到九键输入法

[DDCTF2018](╯°□°)╯︵ ┻━┻(脑洞)

下载文件,txt的内容如下:
Pasted image 20240816163612
最底下的字符串一眼16进制编码,我们进行转码:
Pasted image 20240816164142
是乱码
这里我们需要了解一下十六进制编码是如何将字符串转换成一串十六进制数字的:

十六进制编码是如何将字符串转换成一串十六进制数字的

获取字符的ASCII值->将ASCII值转换为十六进制->组合十六进制值
如:'C' → ASCII: 67 → Hex: 43
我们现将得到的十六进制第一个十六进制值转换为十进制(ASCII值),发现远大于ASCII表中含有的128位字符:
Pasted image 20240816165611
根据做题经验(我遇到过相关的题目,我认为正常思路可能是每128位数后ASCII值就重新开始从0算起),我们将得到的十六进制字符串两两组合成十六进制值后转换成十进制,再减去128,最后将ASCII值(十进制值)转换成字符:

# 假设 data 是十六进制字符串
data = 'd4e8e1f4a0f7e1f3a0e6e1f3f4a1a0d4e8e5a0e6ece1e7a0e9f3baa0c4c4c3d4c6fbb9e1b2e2e5e2b5b4e4b8b7e6e1e1b6b9e4b5e3b8b1b1e3e5b5b6b4b1b0e4e6b2fd'

# 遍历 data,每两个字符作为一个十六进制数,转换为十进制,再转换为对应的 ASCII 字符
result = ''
for i in range(0, len(data), 2):
    # 获取两个字符,组成一个十六进制数
    hex_value = data[i:i+2]
    # 将十六进制数转换为十进制并减去128
    decimal_value = int(hex_value, 16) -128
    # 将十进制数转换为对应的 ASCII 字符
    result += chr(decimal_value)

# 输出转换后的字符串
print(result)

Pasted image 20240816170522
得到了flag
(不知道为什么以上的答案错误了,这里贴出[BUUCTF:[DDCTF2018](╯°□°)╯︵ ┻━┻_ddctf2018╯︵ ┻━┻-CSDN博客](https://blog.csdn.net/mochu7777777/article/details/105324802)写的正确脚本)

# -*- coding:utf-8 -*-  
# author: mochu7  
def hex_str(str):#对字符串进行切片操作,每两位截取  
    hex_str_list=[]  
    for i in range(0,len(str)-1,2):  
        hex_str=str[i:i+2]  
        hex_str_list.append(hex_str)  
    print("hex列表:%s\n"%hex_str_list)  
    hex_to_str(hex_str_list)  
  
def hex_to_str(hex_str_list):  
    int_list=[]  
    dec_list=[]  
    flag=''  
    for i in range(0,len(hex_str_list)):#把16进制转化为10进制  
        int_str=int('0x%s'%hex_str_list[i],16)  
        int_list.append(int_str)  
        dec_list.append(int_str-128)#-128得到正确的ascii码  
    for i in range(0,len(dec_list)):#ascii码转化为字符串  
        flag += chr(dec_list[i])  
    print("转化为十进制int列表:%s\n"%int_list)  
    print("-128得到ASCII十进制dec列表:%s\n"%dec_list)  
    print('最终答案:%s'%flag)  
  
if __name__=='__main__':  
    str='d4e8e1f4a0f7e1f3a0e6e1f3f4a1a0d4e8e5a0e6ece1e7a0e9f3baa0c4c4c3d4c6fbb9b2b2e1e2b9b9b7b4e1b4b7e3e4b3b2b2e3e6b4b3e2b5b0b6b1b0e6e1e5e1b5fd'  
    print("字符串长度:%s"%len(str))  
    hex_str(str)

考点:理解十六进制编码是如何将字符串转换成一串十六进制数字的、脑洞大开、脚本编写

[MRCTF2020]千层套路(脚本编写)

下载文件,发现是一个加密的压缩包,我们按照文件名解压发现密码正确,里面貌似是无尽的压缩包套娃(嵌套压缩包):
Pasted image 20240816172223
因此我们要编写脚本实现相关功能:自动循环解压压缩包到当前文件夹并且解压密码为压缩包的名字,直到没有压缩包为止(我用ai写的)

import os
import zipfile

def extract_zip(file_path):
    # 获取压缩包的文件名(不含扩展名)作为密码
    password = os.path.splitext(os.path.basename(file_path))[0].encode('utf-8')

    # 创建解压目标路径
    extract_path = os.path.dirname(file_path)

    with zipfile.ZipFile(file_path, 'r') as zip_ref:
        try:
            # 解压缩文件并使用密码
            zip_ref.extractall(path=extract_path, pwd=password)
            print(f'Successfully extracted {file_path}')
        except RuntimeError as e:
            print(f'Failed to extract {file_path}. Error: {e}')
            return False
    return True

def recursive_extract(folder_path):
    while True:
        extracted = False
        for root, dirs, files in os.walk(folder_path):
            for filename in files:
                if filename.endswith('.zip'):
                    file_path = os.path.join(root, filename)
                    if extract_zip(file_path):
                        # 删除已解压的压缩包
                        os.remove(file_path)
                        extracted = True
        if not extracted:
            break

if __name__ == "__main__":
    folder_path = '.'  # 当前文件夹路径
    recursive_extract(folder_path)

  • extract_zip函数:

    • 该函数用于解压缩单个 .zip 文件,使用文件名(不含扩展名)作为密码。
    • 如果解压成功,返回 True,否则返回 False
  • recursive_extract函数:

    • 该函数递归地遍历文件夹中的所有文件和子文件夹。
    • 每当发现 .zip 文件时,调用 extract_zip 解压缩。
    • 解压成功后,删除已解压的压缩包,避免重复处理。
    • 如果当前遍历中没有发现压缩包,循环终止。
  • 脚本主程序:

    • folder_path = '.' 表示当前工作目录。

    • 脚本会从当前文件夹开始递归解压。

      最终我们得到了qr.txt,里面的内容如下:
      Pasted image 20240816173028
      包含三个数字,并且只有(255,255,255)和(0,0,0),结合文件名,这是一个二维码的RGB数据
      (255,255,255)代表黑;(0,0,0)代表白
      因此我们要编写脚本实现相关功能:将qr.txt中的RGB数据如(255,255,255)等内容转换成一张图片(也是用AI写的)

from PIL import Image

# 读取qr.txt中的RGB数据
with open('qr.txt', 'r') as file:
    data = file.readlines()

# 假设每一行是一个像素,并且行数与列数一致(即图像是一个正方形)
# 计算图像的尺寸
image_size = int(len(data) ** 0.5)

# 创建一个新的图像
image = Image.new('RGB', (image_size, image_size))

# 填充图像的每个像素
for i, line in enumerate(data):
    # 将RGB数据解析为整数元组
    rgb = tuple(map(int, line.strip().strip('()').split(',')))
    
    # 计算像素在图像中的位置
    x = i % image_size
    y = i // image_size
    
    # 将RGB值设置到图像的相应位置
    image.putpixel((x, y), rgb)

# 保存生成的图像
image.save('output.png')
print('Image saved as output.png')

  • 导入库:

    • 使用 PIL 库中的 Image 模块来创建和操作图像。
  • 读取文件:

    • with open('qr.txt', 'r') as file: 读取文件内容,并将每一行作为一个字符串存储在 data 列表中。
  • 计算图像大小:

    • 假设 qr.txt 中的像素数是一个完全平方数(即图像是正方形),通过 int(len(data) ** 0.5) 计算图像的宽度和高度。
  • 创建图像:

    • 使用 Image.new('RGB', (image_size, image_size)) 创建一个新的RGB图像,大小为 image_size x image_size
  • 填充图像像素:

    • 循环遍历每一行数据,将字符串形式的RGB值转换为整数元组,然后通过 putpixel 方法设置图像中相应位置的像素值。
  • 保存图像:

    • 最后,通过 image.save('output.png') 将生成的图像保存为 output.png 文件。
      最后成功输出了二维码图片,扫描即可得到flag:
      Pasted image 20240816173740
      考点:嵌套压缩包、RGB数据转换成图片、脚本编写

百里挑一

下载文件,发现里面是一个pcap格式的文件,我们使用wireshark打开查看:
Pasted image 20240816173951
按照数据包分析思路,我们先进行协议分级:
Pasted image 20240816174029
发现HTTP协议发送的JPEG File Interchange Format占比最多,媒体文件我们尝试导出对象查看:
Pasted image 20240816175112
一堆图片,按照图片隐写思路我们要查看所有图片的属性寻找关键词,太多了!

exiftool——可交换图像文件格式编辑器

图片属性中的内容都是可交换图像文件格式(英语:Exchangeable image file format,官方简称Exif),我们可以使用这个工具输出一个图片的所有属性如:

exiftool 0.jpg

Pasted image 20240816175745
我们可以使用exiftool分析所有图片的属性,并将输出保存到一个txt文件内部进行分析:

exiftool * > 1.txt

我们在输出里面尝试输入关键词找到了半个flag:
Pasted image 20240816180243
这里我们直接搜索关键词flag也搜得到:
Pasted image 20240816181902
剩下半个flag只能自己去找了,我们只能逐一分析TCP流寻找
最终在114流找到了后半段:
Pasted image 20240816182207
考点:多张图片分析、wiresharkTCP流追踪、耐心
补充:网上有一种解法是搜索关键词“exif”,很快就能过滤出来

[SUCTF2018]followme(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:
Pasted image 20240816183636
按照数据包分析思路,我们先进行协议分级:
Pasted image 20240816183712
发现HTTP协议占比最多,我们尝试导出对象查看:
Pasted image 20240816183851
可以推测攻击机在尝试登录admin的账号,那么flag应该藏在最终结果里面
我们将HTTP导出对象进行大小排列,查看哪个数据包最大,最大的应该就是登录成功的数据包:
Pasted image 20240816184331
在HTTP报文中找到了password的值为flag
Pasted image 20240816184541
考点:网络流量分析
补充:直接搜索关键词“ctf{”直接出结果

[MRCTF2020]CyberPunk(简单)

下载文件,是一个exe可执行文件,我们先运行看看:
Pasted image 20240816185043
我喜欢赛博朋克2077!他在2020.9.17发售,到了那时候我会给你flag!
并且每隔10秒检测当前月份和日期
那么我们将电脑的时间改成9月17日即可
Pasted image 20240917184934
考点:动脑子

[安洵杯 2019]Attack

下载文件,发现里面是一个pcap格式的文件,我们使用wireshark打开查看:
Pasted image 20240816185938
按照数据包分析思路,我们先进行协议分级:
Pasted image 20240816190022
发现HTTP协议发送的Media Type占比最多,我们过滤查看发现并不是真正的媒体文件而是一句话木马:
Pasted image 20240816190208
我们分析http导出对象,发现了一个不得了的文件——lass.dmp:
Pasted image 20240816190528

.dmp文件的重要性

.dmp 文件通常是内存转储(Memory Dump)文件的扩展名。它保存了程序在特定时间点(通常是程序崩溃或发生错误时)内存中的内容。这些文件通常用于调试目的,以帮助开发人员了解程序崩溃或错误发生的原因。
如果 .dmp 文件包含了程序内存中的敏感信息,如明文密码、加密密钥、用户数据等,黑客可能通过分析 .dmp 文件获取这些信息。
我们将.dmp文件导出,使用新工具进行分析——mimikatz

mimikatz——内网渗透神器

Mimikatz 是一个广为人知的开源工具,主要用于安全测试和渗透测试领域。它由法国安全研究员 Benjamin Delpy 开发,最初是为了展示 Windows 操作系统中存在的安全漏洞。Mimikatz 可以执行多种操作,特别是在 Windows 系统上提取敏感信息。
我们使用mimikatz分析.dmp文件:

privilege::debug
//提升 Mimikatz 的权限,使其能够访问某些受保护的进程和内存区域。
sekurlsa::minidump lsass.dmp
//告诉 Mimikatz 加载一个特定的内存转储文件
sekurlsa::logonpasswords full
//用于提取当前系统中所有用户的登录凭证信息,包括明文密码、密码哈希、Kerberos 票据等。

Pasted image 20240816192645
我们可以得到靶机用户Administrator的密码为W3lc0meToD0g3
另一边,我们导出http对象时使用foremost辅助提取出了新东西:
Pasted image 20240816192743
这个zip加密了,在备注里有密码提示:
Pasted image 20240816192835
我们将Administrator的密码作为密码解压,成功得到flag
考点:网络流量分析、分析.dmp文件、导出流量包文件对象

[UTCTF2020]basic-forensics(知识巩固题)

下载文件,是一个打不开的jpeg格式,我们使用010 editor打开:

image-20240817120500299

全是电子书的内容,这种长文本我们直接搜索关键词“flag”或者是“ctf”

image-20240817120705729

考点:关键词搜索

[BSidesSF2019]zippy(知识巩固题)

下载文件,发现里面是一个pcap格式的文件,我们使用wireshark打开查看:

image-20240817121034436

按照数据包分析思路,我们先进行协议分级:

image-20240817121054263

可以发现TCP协议占比最高,我们优先分析传输的Data:

image-20240817121209492

第一个包看内容可以推测:攻击机监听端口4445并且传输了flag.zip文件

image-20240817121601279

第二个包可以发现传输的zip文件,我们可以进行手动提取:

image-20240817121805060

尝试解压发现需要密码,我们先不管,继续分析剩下的包

第三个包可以发现了解压的命令,解压密码为“supercomplexpassword”

image-20240817121904096

解压文件,得到了flag

考点:网络流量分析、学会提取流量包中的文件

[SUCTF 2019]Game(较难新)

下载文件,是一张png格式的图片和html网页小游戏源码

我们优先分析图片,按照图片隐写思路,第一步、第二步无果,我们打开stegsolve打开图片查看:

image-20240817143115550

我们可以发现,当我们关闭红色通道(red plane 0)、绿色通道或是蓝色通道时,图片的上方出现了一点点黑白的印记,虽然不是很明显,我们继续使用StegSolve进行分析

image-20240817143131954

我们发现隐藏信息像是一串base64编码的内容,我们尝试解码:

image-20240817143235311

这里出现了“Salted”的字符串,说明这是加了盐的加密

“U2FsdGVkX1”开头的密文——加了盐的加密

加盐(Salt)是在加密时使用的一个随机值,目的是防止攻击者通过预先计算的哈希表(如彩虹表)快速破解加密数据。通常,盐值会与密码结合,通过一个密钥衍生函数(如 PBKDF2)生成一个足够强的密钥。

我们有了这串加了盐的密文,那么我们明白就应该去寻找密钥了,我们接着分析html网页小游戏源码

搜索关键词flag即得到了这个:

image-20240817154815219

这是一串经过base32编码的字符串(后边有三个“=”的特征,或是使用cyberchef的magic功能自动识别):

image-20240817155101673

这是我们唯一能找到的字符串,因此需要猜测这就是我们需要的密钥!

我们观察我们的密钥,长度为23位或21位(去掉“{}”)或16位(去掉“{}”和“suctf”)

image-20240817155457606

image-20240817155501699

image-20240817155608867

我们常用的对称加密有:DES(需要8位密钥)Triple DES(需要24位密钥)AES(需要16位或24位或32位密钥)、RC4等等,题目没有给出提示我们只能逐个尝试

我们优先尝试AES-128的解密方式,发现并不是:

image-20240817160427628

这里再介绍以下cyberchef的这些模块(更详细的内容以后会更新在crypto方向的模块):

key	密钥

IV	初始化向量,是对称加密算法在某些模式中使用的一个额外输入参数,它保证了相同的明文和密钥在不同的加密操作中会产生不同的密文。通常,IV 应该是随机生成的并且不需要保密,但是它必须和密文一起存储或传输,因为解密时需要相同的 IV

Mode	加密模式

Input	输入格式

Output	输出格式

RC4的各种尝试也不正确,没有其他密码相关的提示,我们貌似陷入了僵局:

image-20240817161549398

对称加密加解密工具的不同

有些DES加解密工具可能采用不同的处理方式,例如自动将较短的密钥扩展为合适的长度,而无需用户明确提供完整的8字节密钥。如Crypto-JS:这是一个 JavaScript 加密库,它在实现上可能更加灵活,例如自动生成 IV、填充或衍生密钥,这使得用户不必关注这些细节。而cyberchef要求用户提供8字节的密钥和一个 IV,这是严格按照标准实现的加密工具。我们可能是使用错了工具所以解不出来!

我们使用在线网址在线加密/解密,对称加密/非对称加密 (sojson.com)进行多次尝试解密发现使用的加密方式是TripleDes

得到了flag:

image-20240817162140869

考点:LSB隐写、关键词搜索、理解对称加密

补充:这道题目是buuctf的简化版,原版题目只有html网页小游戏源码文件

原题我们需要在网页小游戏中找到隐藏的“secret”关键词(buuctf给的源码好像有点问题在此直接展示js源码中搜到的地方):

image-20240817163150896

我们需要使用相关指令才能将该png图片下载出来:

wget http://[靶机IP]/iZwz9i9xnerwj6o7h40eauZ.png

USB(较难新)

下载文件,里面是一个藏着假flag的压缩文件和ftm未知后缀名文件:

image-20240817164344456

我们优先使用010 editor分析:

image-20240817165505653

很长很难分析,我们直接使用binwalk查看其中是否藏了东西:

binwalk key.ftm -e 

image-20240817165800462

藏了东西,主要是有一个pcap流量包,我们进行协议分级分析只有物理层的USB相关协议:

image-20240817170101553

USB键盘流量包详解

usb.capdata 是 USB 数据包中的最主要的字段,用于显示捕获的 USB 数据的原始字节。这些字节通常表示设备在 USB 总线上发送的实际数据。对于 USB 键盘,usb.capdata 通常包含按键操作的编码信息。比如我们分析一下第一个数据包:

image-20240817171817189

usb.capdata的值为0002000002000000

第一个字节 (00): 修饰键(Modifier Key)状态,如 Ctrl、Shift、Alt 等。值为 00 表示没有修饰键被按下。

第二个字节 (02): 保留位(Reserved)。通常没有特别意义,固定为 00

第三到第八个字节 (00 02 00 00 00 00): 这些字节表示按键编码(Keycode)。每个字节表示一个按键,其中 00 表示没有按键被按下。按键编码 02 对应的是大键盘 1 键。

更多可以参考202106241624549419156181.pdf (willhsu.com)

总之这个流量包记录了USB连接的键盘输入数据,我们应该进行提取和分析。

在此我们也可以直接使用工具脚本:UsbKeyboardDataHacker

image-20240817173239108

提取出了键盘输入的内容,得到了关键信息key{xinan}提交了发现并不是flag

那么我们只能继续对233.rar进行分析了,我们可以注意到当我们使用winrar打开时会报错:

image-20240817215232921

我们使用RAR模板打开好像抽风了,我们只好手动分析:

image-20240817220435791

RAR文件格式简介(原文:RAR文件格式学习(了解)_rar文件头-CSDN博客CTF解题技能之压缩包分析基础篇 - FreeBuf网络安全行业门户

RAR是有四个文件块组成的,分别是分别是标记块、压缩文件头、文件块、结束块,这些块之间没有固定地先后顺序,但要求第一个块必须是标志块并且其后紧跟一个归档头部块。每个块都包含以下内容:

内容.webp.jpg

标记块(MARK_HEAD)

第一块为标记块(MARK_HEAD),其数据为:

52 61 72 21 1A 07 00

字节的说明

52 61 为头部校验和(HEAD_CRC),占两个字节,每一块均从HEAD_CRC开始,所有的RAR都以 52 61 开头

72 为 块类型(HEAD_TYPE) 占一个字节,所有文件都如此

21 1A 为 块标记(HEAD_FLAGS) 占两个字节

07 00表示块大小 ,即 52 61 72 21 1A 07 00 (标记块)共占7个字节

压缩文件头(MAIN_HEAD)

第二块为压缩文件头(MAIN_HEAD) ,和标记块一样:

CF 90 73 00 00 0D 00 00 00 00 00 00 00

在这里插入图片描述

CF 90	压缩文件头CRC校验值
73	头类型是0x73表示压缩文件头块
00 00	位标记,没有位被置为1 ,如果块头被加密,则位标记应该为:0x8000
0D 00	文件头大小为0x0D00,由上图可以看出这个压缩文件头块占13个字节

文件头(FILE_HEAD)

RAR文件格式及其各字段含义请参考官方文档:RAR 5.0 archive format (rarlab.com)

接下来用rar文件来讲一下文件头部分的码流分析。

在这里插入图片描述

16进制软件使用winhex,hex值左边是低位,右边是高位,比如52 61 实际上就是0x6152

D5 56 :HEAD_CRC,2字节,也就是文件头部分的crc校验值
74 :HEAD_TYPE,1字节,块类型,74表示块类型是文件头
20 90 :HEAD_FLAGS,2字节,位标记,这块在资料上没找到对应的数值,不知道20 90代表什么意思。
2D 00 :HEAD_SIZE,2字节,文件头的全部大小(包含文件名和注释)
10 00 00 00 :PACK_SIZE,4字节,已压缩文件大小
10 00 00 00 :UNP_SIZE,4字节,未压缩文件大小
02:HOST_OS,1字节,保存压缩文件使用的操作系统,02代表windows
C7 88 67 36:FILE_CRC,4字节,文件的CRC值
6D BB 4E 4B :FTIME,4字节,MS DOS 标准格式的日期和时间
1D:UNP_VER,1字节,解压文件所需要的最低RAR版本
30:METHOD,1字节,压缩方式,这里是存储压缩
08 00 :NAME_SIZE,2字节,表示文件名大小,这里文件名大小是8字节(flag.txt)
20 00 00 00 :ATTR,4字节,表示文件属性这里是txt文件
66 6C 61 67 2E 74 78 74:FILE_NAME(文件名) ,NAME_SIZE字节大小,这里NAME_SIZE大小为8
再往后是txt文件内容,一直到第六行 65 结束,下面是另一个文件块的开始

这个块中存在两个crc值,一个是文件头块中从块类型到文件名这38个字节的校验,后一个则是压缩包中所包含文件的crc校验,解压时,会计算解压后生成文件的crc值,如果等于这里的crc,则解压完成,如果不同,则报错中断。

结尾块

这个结尾块和标记块字节大小和分析方法是一样的。

在这里插入图片描述

C4 3D :HEAD_CRC,2字节,从HEAD_TYPE到HEAD_SIZE的crc校验值
7B :HEAD_TYPE,1字节,表示该块是结尾块
00 40 HEAD_FALGS ,2字节,位标记
07 00 :HEAD_SIZE,2字节,块大小
与标记块类似的是,结尾块也是一个固定字节串的块,依次是 C4 3D 7B 00 40 07 00

有了上面的RAR文件格式的分析,结合报错信息我们可以发现RAR文件的“233.png”文件头的HEAD_TYPE应为“74”却被改成了“7A”,我们修改回来,压缩包中藏着的233.png总算是出来了:

image-20240817221938541

(补充:更新了010 editor版本后就没有抽风了,我们看看正常模板解析的情况下的回显。可以发现233.png的HeadType错误,应该为FILE)

image-20240819094905298

image-20240819103245773

我们开始分析233.png文件

按照图片隐写思路,第一步、第二步无果,我们打开stegsolve打开图片查看,发现关闭蓝色通道会出现二维码,我们扫描出现了如下信息:

image-20240817222520707

然而,这个也不是flag,按照之前得到的值,我们可以知道这串字符串一定是使用了密钥“xinan”加密的内容。

按照思路,我们需要将所有需要密钥的密码都尝试一遍,并得出最有可能的结果

需要密钥的加密方式思路顺序从古典到现代并且大众所知

维吉尼亚密码->Playfair密码->数据加密标准 (DES)->三重DES (Triple DES)->AES->RC4->Rabbit等等……(越到后边越需要复杂的条件)

我们按顺序来,发现是维吉尼亚密码加密(看上去比较合理):

image-20240817223744042

image-20240817223748358

我们可以看出维吉尼亚密码解密后明文以“f”开头,这种调换顺序的密码让人想要尝试栅栏密码,成功得到flag:

image-20240817224148170

考点:理解USB流量分析并且会使用工具脚本、能够发现RAR文件中的文件头的HEAD_TYPE被修改了、LSB隐写、拥有需要密钥的加密方式的解密思路

[GUET-CTF2019]虚假的压缩包(较难新)

下载文件,里面是两个压缩包,“虚假的压缩包”和“真实的压缩包”,二者都进行了加密

我们逐一进行分析,第一步无果发现了“虚假的压缩包”存在伪加密:

image-20240819104646288

我们得到了key:

image-20240819104851932

看到熟悉的参数n和e,我们立刻能够联想到RSA加密的方法(详细会更新在crypto模块中)

在此我们直接解密:

n = 3 * 11		则p = 3 , q = 11
φ(n) = (p-1) * (q-1) = 20
gcd(e , φ(n)) = 1	(要满足e与φ(n)的公因数为1,3和20的公因数确实是1)
(d * e) mod φ(n) = 1	则解密私钥d = 7

c = m^e mod n		若明文m为解26,c为密文,得出答案是c = 20
m = c^d mod n		若密文c为解26,m为明文,得出答案是m = 5

离谱的是解压密码为“密码是5”(需要脑洞打开,能用的字符都要考虑到)

解压文件,里面是一张jpg图片和一个名为“亦真亦假”的无后缀文件

我们优先分析图片,按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240819112537967

看这文件头,这应该是PNG格式的文件,我们进行修改再按照图片隐写思路,png图片第一步使用TweakPNG工具发现图片的crc校验出现错误,因此可能存在PNG宽高隐写:

image-20240819112808489

我们使用脚本爆破PNG图片的正确宽高,修改即可:

image-20240819113045370

image-20240819113135794

可以发现隐藏的信息:

image-20240819113211415

这里的“5”与上面提到过的“me”不一样,"^"在数学式中表示的是次方,在编程语言里面表示的是异或计算

我们再使用010 editor打开“亦真亦假”文件,发现就是一文本格式的文件,内容看上去是十六进制的编码:

image-20240819114140430

按照提示,这些内容应该经过“^5”(与5进行异或)的计算(5异或5值为0,这里可以看出有几段文件流)

我们可以使用010 editor的计算工具进行运算:

image-20240819114725342

异或后发现并不能得出什么文件,后来发现是以文本编辑的形式异或和以十六进制编辑的形式异或会有两种计算方式:

十六进制编辑的形式异或:将“e”与“5”的ASCII值进行异或
"e" 的 ASCII 值是 101(十进制),101 的二进制表示为 01100101。
"5" 的 ASCII 值是 53(十进制),53 的二进制表示为 00110101。
01100101  (101, "e")
XOR
00110101  (53, "5")
--------
01010000  (80)
得到的“80”转为字符为“`”
十六进制编辑的形式异或:将“e”与“5”看做十六进制进行异或
"e" 是16进制,转换为二进制是 1110。
"5" 是16进制,转换为二进制是 0101。
1110   (e)
XOR
0101   (5)
----
1011   (b)
结果 1011 对应的十六进制值是 "b"。

我们以十六进制编辑的形式进行异或:

image-20240819144752516

image-20240819150319672

结果将每个字节的十六进制与“05”进行了异或,没有看出有什么东西,也没有达到我们想要的效果

在此只好写一个脚本,能够实现将一个文件中所有字符看做十六进制数字并且与5进行异或:

# 读取1.txt中的内容
with open("1.txt", 'r') as input_file:
    content = input_file.read().strip()  # 去除文件中多余的空白字符

# 打开2.txt以写入处理后的结果
with open("2.txt", 'w') as output_file:
    # 遍历文件中的每个字符
    for char in content:
        # 将字符转换为十六进制整数
        hex_value = int(char, 16)
        
        # 与5进行异或操作
        xor_result = hex_value ^ 0x5
        
        # 将结果转换为十六进制字符并写入到2.txt
        output_file.write(hex(xor_result)[2:])

image-20240819151639462

以复制十六进制编辑:

image-20240819151716498

能够发现是以“PK”开头的zip压缩文件,总算成功了!

我们查看里面的文件,发现是doc文件

image-20240819151826886

我们修改后缀后打开:

image-20240819151948102

我们搜索关键词“flag”,发现藏在最后,字体颜色为白色。得到了flag:

image-20240819152053496

考点:压缩包伪加密、PNG宽高隐写、理解RSA算法、理解异或计算、理解office文件是一堆文件的压缩文件

[RCTF2019]draw(新工具)

下载文件,是个txt文本,打开查看:

image-20240819152419798

一头雾水,拿去问AI:

image-20240819152617429

我们明白了这是Logo编程语言的代码,我们应该如何让这些代码跑起来呢?

image-20240819152810399

在此使用了Logo解释器 (calormen.com)我们可以得出flag:

image-20240819153611940

考点:不会就搜索就问、理解logo编程语言

[ACTF新生赛2020]明文攻击

下载文件,里面是一个加密的压缩包和一张图片:

image-20240819153845888

我们优先对图片进行分析

第一步无果,我们优先打开010 editor打开图片查看:

发现有插入隐藏的zip文件,而且缺少文件头“PK”我们尝试修复后进行文件分离:

image-20240819155055868

我们解压查看:

image-20240819155219404

我们尝试了,这不是解压密码,那这是什么呢?

我们查看加密压缩包的内容,它的里面也有flag.txt文件,并且二者的CRC校验值是一样的!说明二者是相同的文件。

image-20240819155347154

按照题目提示,这里可以使用ZIP明文攻击。

ZIP已知明文攻击

ZIP文件通常使用对称加密算法(如PKZIP的经典加密方式),并使用一个相对简单的流密码算法(CRC-32校验值和三个32位寄存器)来加密数据。这种方法依赖于一个用户提供的密码生成密钥流,对文件内容进行加密。

前提:在已知明文攻击中,攻击者已经获得了一部分加密文件的对应明文(未加密内容),并且能够访问对应的加密数据(密文)。

步骤1:获取已知明文和对应密文:攻击者知道ZIP文件中某些已加密文件的部分内容。例如,ZIP文件中可能包含一个常见文件如README.txt,攻击者可能已经知道其中的一些文本内容(明文),同时可以访问该文件的加密版本(密文)。

步骤2:推导密钥流:攻击者利用已知的明文和对应的密文来反推出生成密文的密钥流。由于ZIP使用的加密算法基于流密码,明文与密钥流的XOR(异或)操作生成密文。因此,如果知道明文和密文,攻击者可以通过简单的异或操作推导出密钥流的一部分。

步骤3:恢复密钥:利用推导出的密钥流,攻击者可以逐步逆推出用于加密的内部状态和密钥,进而推算出完整的加密密钥。

步骤4:解密整个文件:一旦掌握了密钥,攻击者可以使用该密钥解密ZIP文件中其他的内容,甚至解密整个ZIP文件。

可以参考视频https://www.bilibili.com/video/BV1qW4y1L7tN?vd_source=69c558b0c7be97607c79afbd75bd1f7c

1分50秒至3分41秒

使用ARCHPR对压缩包进行已知明文攻击

image-20240819160441104

如图所示,明文攻击所需时间比较久,我们只有耐心等待,最终得到加密密钥,我们可以保存已解密的压缩包,得到flag

image-20240819165435758

考点:利用十六进制编辑器找到隐藏的信息、文件头修复、理解压缩包明文攻击

[DDCTF2018]流量分析(新)

下载文件,是一个pcap格式的流量包和提示:

image-20240819160656411

按照数据包分析思路,我们先进行协议分级:

image-20240819160807744

我们发现TCP协议占比最高,并且使用了TLS协议加密(Transport Layer security);协议中使用了FTP协议并且占比非常高,优先查看FTP协议发了些什么文件,过滤FTP Data并且尝试导出对象:

image-20240819161432788

尝试解压都加密了……

那么我们只能退而求其次,开始过滤分析TCP协议的内容,追踪TCP流从0开始看起,发现前面的数据包都是空的:

image-20240819162004889

前面的TCP流量全是空的因为前面都是握手包:Wireshark的捕获设置可能限制了捕获的数据包数量或大小。如果某个TCP流的数据包在捕获开始或结束之前已经传输完毕,或者超过了捕获的窗口大小,你可能只会看到TCP连接建立(SYN、ACK等)或终止(FIN、RST等)的包,而没有数据包。那么我们直接跳过握手包,跳到有内容的数据包并追踪流:

image-20240819162136135

追踪TCP流2002,这段TCP流量数据包描述了一次FTP会话的过程,其中包含了用户登录、文件传输和错误处理的相关信息。

image-20240819162428259

1. FTP服务器连接:
	220 (vsFTPd 3.0.2):客户端连接到FTP服务器,服务器响应表示欢迎,并告知使用的FTP服务版本是vsFTPd 3.0.2。
2. 用户登录:
	USER zhangsan:客户端尝试以用户名“zhangsan”登录。
	331 Please specify the password.:服务器请求用户提供密码。
	PASS zhangsan:客户端提供密码(明文显示,实际传输中不建议明文传输密码)。
	230 Login successful.:服务器确认登录成功。
3. 系统信息查询:
	SYST:客户端请求服务器的系统类型。
	215 UNIX Type: L8:服务器响应,表示它运行在UNIX系统上,类型为L8。
4. 进入被动模式:
	PASV:客户端请求服务器进入被动模式(PASV模式),以便进行数据传输。
	227 Entering Passive Mode (172,17,0,2,229,182).:服务器响应进入被动模式,并提供了数据连接的IP地址和端口号(组合起来为端口58726,229*256+182=58726)。
5. 目录列表传输:
	LIST:客户端请求列出当前目录的内容。
	150 Here comes the directory listing.:服务器开始传输目录列表。
226 Directory send OK.:服务器确认目录列表传输完成。
6. 文件传输 (Fl-g.zip):
	TYPE I:客户端请求切换到二进制传输模式。
	200 Switching to Binary mode.:服务器确认切换到二进制模式。
	PASV:客户端再次进入被动模式。
	227 Entering Passive Mode (172,17,0,2,116,151).:服务器提供新的数据连接端口(组合为29847)。
	RETR Fl-g.zip:客户端请求下载文件“Fl-g.zip”。
	150 Opening BINARY mode data connection for Fl-g.zip (24732680 bytes).:服务器开始传输文件,文件大小为24,732,680字节。
	226 Transfer complete.:服务器确认文件传输完成。
7. 文件传输 (sqlmap.zip):
	与上一步类似的过程,只不过文件名称为“sqlmap.zip”,大小为15,288,181字节。
8. 再次列出目录:
	TYPE A:客户端切换到ASCII传输模式。
	200 Switching to ASCII mode.:服务器确认切换到ASCII模式。
	PASV:客户端进入被动模式。
	227 Entering Passive Mode (172,17,0,2,223,125).:服务器提供新的数据连接端口(组合为57149)。
	LIST:客户端请求再次列出当前目录的内容。
	150 Here comes the directory listing.:服务器开始传输目录列表。
	226 Directory send OK.:服务器确认目录列表传输完成。
9. 尝试上传文件:
	TYPE I:客户端再次切换到二进制传输模式。
	200 Switching to Binary mode.:服务器确认切换到二进制模式。
	PASV:客户端进入被动模式。
	227 Entering Passive Mode (172,17,0,2,184,236).:服务器提供新的数据连接端口(组合为47300)。
	STOR /etc/profile:客户端尝试上传文件到服务器的“/etc/profile”路径。
	553 Could not create file.:服务器拒绝了上传请求,可能是由于权限不足或路径问题。
10. 退出会话:
	QUIT:客户端请求断开连接。
	221 Goodbye.:服务器确认断开连接。

追踪TCP流2003,这段数据是从FTP服务器返回的目录列表中的一部分,列出了两个文件的详细信息

image-20240819162915414

追踪TCP流2004和2005,传输了两个个zip文件

image-20240819163903488

image-20240819163946585

追踪TCP流2006,这段数据是从FTP服务器返回的目录列表中的一部分,列出了两个文件的详细信息

image-20240819164033613

追踪TCP流2007,这段TCP流量数据包描述了一次与邮件服务器(MX服务器)的交互过程,显示了客户端尝试发送邮件时所经历的各个阶段。

image-20240819164144434

1. 连接建立:
	220 mx1.aliyun-inc.com MX AliMail Server(10.147.2.124):
	这是邮件服务器向客户端发送的欢迎消息,表示连接成功。服务器的域名为mx1.aliyun-inc.com,IP地址为10.147.2.124。
2. EHLO 命令:
	EHLO 7e040dcc799e.didi-ctf.com:
	客户端向服务器发送EHLO命令(Extended HELO),以开始SMTP会话,并告知服务器客户端的标识(7e040dcc799e.didi-ctf.com)。
		服务器响应:
		250-mx1.aliyun-inc.com:服务器确认接受了EHLO,并列出支持的SMTP扩展功能。
		250-STARTTLS:服务器支持STARTTLS命令,可以升级到加密连接。
		250-8BITMIME:支持8位MIME传输。
		250-AUTH=PLAIN LOGIN XALIOAUTH 和 250-AUTH PLAIN LOGIN XALIOAUTH:支持的身份验证方式包括PLAIN、LOGIN和XALIOAUTH。
		250-PIPELINING:服务器支持指令流水线操作。
		250 DSN:支持传递状态通知(Delivery Status Notification)。
3. 发送邮件地址:
	MAIL FROM:<support@ttlsa.com>:
	客户端发送MAIL FROM命令,指定发件人地址为support@ttlsa.com。
		服务器响应:
		250 Mail Ok:服务器确认接收发件人地址。
4. 指定收件人地址:
	RCPT TO:<dengyun@ttlsa.com> ORCPT=rfc822;dengyun@ttlsa.com:
	客户端发送RCPT TO命令,指定收件人地址为dengyun@ttlsa.com,并通过ORCPT参数指定原始收件人地址(适用于某些邮件转发场景)。
		服务器响应:
		554 Reject by behaviour spam at Rcpt State(Connection IP address:111.202.154.85)ANTISPAM_BAT[01201311R136a, e02c03309]: spf check failed CONTINUE:
		服务器拒绝了收件人地址。拒绝的原因可能是因为发件人的IP地址111.202.154.85被认为是垃圾邮件来源,且SPF(Sender Policy Framework)检查失败。
5. 数据传输尝试:
	DATA:
	客户端尝试发送DATA命令,准备传输邮件内容。
		服务器响应:
	503 bad sequence of commands:服务器返回503错误,表示命令序列错误。因为前面的RCPT TO命令已经被拒绝,所以继续发送DATA命令是不符合协议的。
6. 连接重置和断开:
	RSET:
	客户端发送RSET命令,重置会话状态,清除所有已发送但未完成的命令。
	QUIT:
	客户端发送QUIT命令,请求断开连接。
		服务器响应:
		服务器断开连接,完成会话。

追踪TCP流2008,这段TCP流量描述了一次邮件传输的过程,其中出现了一个邮件退回(bounce)通知。这是邮件系统自动生成的,用于告知发件人邮件未能成功递送。

image-20240819164654836

1. 连接建立
	220 mx1.aliyun-inc.com MX AliMail Server(10.147.10.221):服务器发送的欢迎消息,表示已成功建立连接。
2. EHLO 命令
	EHLO 7e040dcc799e.didi-ctf.com:客户端向服务器发送EHLO命令,声明客户端的标识。
		服务器响应:
		250-STARTTLS:服务器支持STARTTLS命令,可以升级到加密连接。
		250-8BITMIME:服务器支持8位MIME传输。
		250-AUTH PLAIN LOGIN XALIOAUTH:服务器支持的身份验证方式。
		250-PIPELINING:服务器支持流水线操作。
		250 DSN:服务器支持传递状态通知(Delivery Status Notification)。
3. 邮件发送
	MAIL FROM:<>:发送者地址为空,表示这是一个邮件系统自动生成的邮件(例如退信通知)。
	RCPT TO:<support@ttlsa.com>:指定收件人地址为support@ttlsa.com。
4. 数据传输
	DATA:客户端准备发送邮件内容。
		服务器响应:
		250 Mail Ok和250 Rcpt Ok:服务器确认了邮件发送和收件人地址。
		354 End data with <CR><LF>.<CR><LF>:服务器指示客户端可以开始传输邮件内容,结束符为.。
5. 邮件传输结束
	.:客户端发送了数据结束标记。
	250 Data Ok: queued as freedom:服务器确认邮件数据已成功接收并放入队列处理。
	QUIT和221 Bye:会话结束,连接断开。

邮件内容是一个退信通知,说明邮件无法递送,包含以下关键信息:

退回的原因<dengyun@ttlsa.com>: host mxn.mxhichina.com[42.120.219.27] said: 554 Reject by behaviour spam at Rcpt State(Connection IP address:111.202.154.85)ANTISPAM_BAT[01201311R136a, e02c03309]: spf check failed CONTINUE。这表明邮件被目标邮件服务器拒绝,原因是发件人的IP地址111.202.154.85被识别为垃圾邮件来源,并且SPF(Sender Policy Framework)检查失败。

诊断代码554 表示邮件在传输过程中的永久性错误,导致邮件无法投递。

追踪TCP流2009,TCP握手包没有特殊内容

image-20240819165146339

接下来的几个数据包都是发送的邮件

值得注意的是追踪TCP流2016我们发现邮件里插入了一段经base64编码的图片:

image-20240819170613419

我们进行解码:

image-20240819170634210

得到了一张图片,我们识别再解码:

image-20240819171015857

发现是乱码,因此我们可以猜测这是我们寻找的TLS协议加密的密钥,我们按照提示给密钥进行套皮:

-----BEGIN RSA PRIVATE KEY-----
MIICXAIBAAKBgQDCm6vZmclJrVH1AAyGuCuSSZ8O+mIQiOUQCvN0HYbj8153JfSQ
LsJIhbRYS7+zZ1oXvPemWQDv/u/tzegt58q4ciNmcVnq1uKiygc6QOtvT7oiSTyO
vMX/q5iE2iClYUIHZEKX3BjjNDxrYvLQzPyGD1EY2DZIO6T45FNKYC2VDwIDAQAB
AoGAbtWUKUkx37lLfRq7B5sqjZVKdpBZe4tL0jg6cX5Djd3Uhk1inR9UXVNw4/y4
QGfzYqOn8+Cq7QSoBysHOeXSiPztW2cL09ktPgSlfTQyN6ELNGuiUOYnaTWYZpp/
QbRcZ/eHBulVQLlk5M6RVs9BLI9X08RAl7EcwumiRfWas6kCQQDvqC0dxl2wIjwN
czILcoWLig2c2u71Nev9DrWjWHU8eHDuzCJWvOUAHIrkexddWEK2VHd+F13GBCOQ
ZCM4prBjAkEAz+ENahsEjBE4+7H1HdIaw0+goe/45d6A2ewO/lYH6dDZTAzTW9z9
kzV8uz+Mmo5163/JtvwYQcKF39DJGGtqZQJBAKa18XR16fQ9TFL64EQwTQ+tYBzN
+04eTWQCmH3haeQ/0Cd9XyHBUveJ42Be8/jeDcIx7dGLxZKajHbEAfBFnAsCQGq1
AnbJ4Z6opJCGu+UP2c8SC8m0bhZJDelPRC8IKE28eB6SotgP61ZqaVmQ+HLJ1/wH
/5pfc3AmEyRdfyx6zwUCQCAH4SLJv/kprRz1a1gx8FR5tj4NeHEFFNEgq1gmiwmH
2STT5qZWzQFz8NRe+/otNOHBR2Xk4e8IS+ehIJ3TvyE=
-----END RSA PRIVATE KEY-----

将上述私钥保存为.key格式的文件

image-20240819172329983

wireshark功能六:导入密钥

SSL/TLS是一种密码通信框架,TLS协议位于传输层和应用层中间,其功能是一个加密通道,和上层应用协议无关。由于HTTP采用明文传输,很容易被攻击者窃听或者篡改内容,通过引用TLS对HTTP的内容进行加密等操作,可以有效防止窃听、篡改和劫持等。

参考视频https://www.bilibili.com/video/BV1uY4y1D7Ng?vd_source=69c558b0c7be97607c79afbd75bd1f7c

我们需要导入我们获得的私钥文件进行解密:

image-20240819172024907

image-20240819172244862

导入私钥成功后我们就可以查看http协议中加密的内容了:

image-20240819172441217

发现http数据包中藏有flag

考点:理解FTP协议、理解SMTP协议、在流量数据中寻找私钥、理解SSL/TLS密码通信框架、学会使用wireshark导入私钥文件

[SWPU2019]Network(新脑洞)

下载文件,是一个txt文件,看上去像是ascii值但是最大的超过了127所以我们排除这方向的思路:

image-20240819175529154

按照题目提示Network,这里必定是存在与网络相关的加密方式

我们先分析密文,密文仅有“63”、“127”、“191”、“255”四个数字,因此我们可以猜测这与两位二进制相关加密有关(两位二进制仅有”00“、”01“、”10“、”11“四个数字)

在此提出新的加密方式——TTL隐写

TTL隐写

TTL隐写(TTL Steganography)是一种利用网络数据包的生存时间(Time To Live, TTL)字段进行数据隐写的技术。TTL字段是IPv4协议头中的一个8位字段,用来限制数据包在网络中的存活时间,每经过一个路由器或网络设备,这个值就会减一,当TTL值为0时,数据包会被丢弃。

TTL隐写的基本原理是通过控制数据包的TTL值来传输隐秘信息。具体而言,攻击者或隐写者可以在发送数据包时,将TTL字段设置为特定的值以表示某种信息。接收方只需要解析数据包中的TTL字段并恢复原始信息即可。

我们分析密文:

63(二进制后)=00111111
127(二进制后)=01111111
191(二进制后)=10111111
255(二进制后)=11111111

发现仅有最前面的两位数字不同,因此我们可以猜测明文由密文二进制后前两位组合而成

那么我们可以编写一个脚本,将63转换成00、将127转换成01、将191转换成10、将255转换成11后将所有内容组合起来(或者说是将密文转换成二进制后提取前两位,但前者应该更加高效)

# 定义一个映射表,将数值映射到二进制字符串
mapping = {
    '63': '00',
    '127': '01',
    '191': '10',
    '255': '11'
}

# 读取attachment.txt文件内容
with open('attachment.txt', 'r') as file:
    content = file.read()

# 将内容根据映射表进行替换
result = ''
for value in content.split():
    if value in mapping:
        result += mapping[value]
    else:
        print(f"Value {value} not found in mapping table.")

# 输出组合后的二进制字符串
print(result)

# 将结果保存到一个新的文件中
with open('output.txt', 'w') as outfile:
    outfile.write(result)
def hex_to_binary(hex_str):
    # 将十六进制字符串转换为二进制字符串,并去掉前缀 '0b'
    binary_str = bin(int(hex_str, 16))[2:]
    # 保证二进制字符串长度是8的倍数,前面补充0
    binary_str = binary_str.zfill(8)
    return binary_str

def dec_to_binary(dec_str):
    # 将十进制字符串转换为二进制字符串,并去掉前缀 '0b'
    binary_str = bin(int(dec_str))[2:]
    # 保证二进制字符串长度是8的倍数,前面补充0
    binary_str = binary_str.zfill(8)
    return binary_str

# 配置开关,选择十六进制或十进制
is_hex = False  # 设置为True表示十六进制,False表示十进制

# 读取attachment.txt文件内容
with open('attachment.txt', 'r') as file:
    lines = file.readlines()

# 初始化结果字符串
result = ''

# 遍历每一行,将每一行的数值转换成二进制并提取前两位
for line in lines:
    line = line.strip()  # 去掉行末的换行符
    if is_hex:
        binary_representation = hex_to_binary(line)
    else:
        binary_representation = dec_to_binary(line)
    
    # 提取前两位
    result += binary_representation[:2]

# 输出组合后的二进制字符串
print(result)

# 将结果保存到一个新的文件中
with open('output.txt', 'w') as outfile:
    outfile.write(result)


不知道是不是以上脚本都非常低效,跑了我好久(也可能是密文文件太大了)

总之得到了二进制的文本,我们进行转换:

image-20240826104652126

image-20240826104750137

看文件头是zip压缩文件,保存输出后解压发现加密了,发现是伪加密,我们进行修改即可解压(多处deFlags):

image-20240826110209454

打开flag.txt发现内容被base64编码了数次,我们进行解码即可得到flag:

image-20240826110613026

考点:理解TTL隐写、压缩包伪加密

[GKCTF 2021]签到(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看

image-20240826100922223

我们先进行协议分级:

image-20240826101048786

发现HTTP协议发送的Line-base text data占比最多,我们优先过滤查看:

image-20240826101220136

我们可以发现服务器给的返回包中包含的数据是十六进制的字符串,我们进行进制转换:

image-20240826101310893

可以发现转换出了一个文件名,但文件名好像倒序了,我们加上倒序发现:

image-20240826101446350

我们可以追踪http流查看具体是做了什么请求:

image-20240826101634572

发现是通过向一个tmpshell.php发送请求查看当前目录文件得到的回显,我们一路分析流,发现了请求“f14g”的内容,我们解码发现没有东西:

image-20240826101857219

image-20240826101909612

接着往下看,发现了经base64编码的“f14g”,我们提取并且解码:

image-20240826102011396

我们发现当前解码的内容是经过了每一行的倒序的(根据结尾“==”的位置判断),这里我们可以手动一行行的进行倒序,也可以写脚本:

# 读取1.txt文件内容
with open('1.txt', 'r') as file:
    lines = file.readlines()

# 初始化倒序结果列表
reversed_lines = []

# 遍历每一行,进行倒序处理
for line in lines:
    line = line.strip()  # 去掉行末的换行符
    reversed_line = line[::-1]  # 将字符串倒序
    reversed_lines.append(reversed_line)

# 将倒序后的结果写入一个新的文件,或者输出到控制台
with open('output.txt', 'w') as outfile:
    for reversed_line in reversed_lines:
        outfile.write(reversed_line + '\n')

# 可选:输出到控制台
for reversed_line in reversed_lines:
    print(reversed_line)

image-20240826104151251

我们进行解码得到:

image-20240826104338316

可以发现flag的输出都输出了两遍,我们进行修改即可得到flag

考点:网络流量分析、观察解密

[MRCTF2020]Hello_ misc(知识巩固题脑洞)

下载文件,里面是一个加密的rar压缩包和一张图片

我们优先对图片进行分析,第一步无果,我们优先使用010 editor分析,发现了插入隐藏的压缩包:

image-20240826111413477

我们提取出来发现这个压缩包也进行了加密,我们根据图片可以推测这张图片还藏了东西,我们进入第三步继续分析图片:

image-20240826112509767

image-20240826112523079

发现在红色通道和蓝色通道存在这种隐藏的数据,我们进行排列组合LSB解密终于得到了一张PNG图片:

image-20240826113040497

image-20240826113108620

得到了zip文件的密码,我们进行解压得到output.txt:

image-20240826113327755

又是ttl隐写,我们进行解密得到rar文件密码:

image-20240826113626265

解压得到了fffflag.zip文件,我们打开发现了word文件夹,可以推测这是一个doc文件,我们修改后缀打开:

image-20240826113907115

推测flag内容为白色字体,我们修改字体颜色发现隐藏内容:

image-20240826113952108

进行解码发现是乱码:

image-20240826114028958

我们只能返回上一步,我们推测这并不是二进制的内容:

那么我们只能分析其中不对劲的地方,我们可以发现base64的编码内容是有换行符的,我们一行一行的进行解密再组合:

110110111111110011110111111111111111111111111111101110000001111111111001101
110110110001101011110111111111111111111111111111111101111111111111110110011
110000101110111011110111111100011111111111001001101110000011111000011111111
110110100001111011110111111011101111111110110110101111111100110111111111111
110110101111111011110111101011101111111110110110101101111100110111111111111
110110100001100000110000001100011100000110110110101110000001111000011111111

此时输出的内容若隐若现,我们脑洞大开将所有数字1改为空格:

image-20240826114719624

是的,得到了flag

He1Lo_mi5c~

考点:图片插入隐写、lsb隐写、ttl隐写、脑洞大开

[UTCTF2020]zero(新)

下载文件,查看内容:

image-20240826115216041

发现有很多不可打印字符,我们尝试使用010 editor进行解析发现这些字符也都是乱码:

image-20240826120320171

零宽字符隐写原理

零宽字符隐写的基本原理是将要隐藏的信息编码为零宽字符序列,并将其插入到文本中的某些特定位置。因为这些字符在普通文本显示时不可见,所以文本看起来与原始文本没有区别。

字符包括:

零宽度空格(\u200b)

零宽度非连接符(\u200c)

零宽度连接符(\u200d)

从左至右书写标记(\u200e)

从右至左书写标记(\u200f)

将要隐藏的信息(通常是二进制数据或文本)编码成零宽字符的序列。例如,可以将二进制“0”编码为零宽度空格\u200B,将二进制“1”编码为零宽度不连字\u200C,嵌入普通文本中就不会被发现

我们可以使用在线网站(Unicode Steganography with Zero-Width Characters (330k.github.io))进行解密得到flag:

image-20240826115520483

考点:理解零宽字符隐写原理

[WUSTCTF2020]spaceclub(知识巩固题)

下载文件,貌似是一个空文件,但我们发现ctrl+a选中全文发现隐藏着空格:

image-20240826143906501

空格的排列只有短和长两种形态,但是没有分隔符,不能猜测是摩斯电码,那猜测是二进制,我们进行替换解出flag:

image-20240826144336546

考点:对相关密码的敏感

CFI-CTF 2018]webLogon capture(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看:

image-20240826145008328

只有九个数据包,我们可以逐一分析,直接追踪http流:

image-20240826145111412

可以发现攻击机一直在向服务器发送请求,请求内容含有的参数是email和password,但服务器一直回显“Incorrect username or password”,我们将密码进行url解码直接得到flag了。。。

考点:网络流量分析

[ACTF新生赛2020]music(新)

下载文件,是一个.m4a格式的音频文件,但是已损坏打不开,我们使用010 editor打开进行分析:

image-20240826150117850

我们可以发现文件中含有很多“A1”字符,不禁让我想起了网易云VIP音乐破解的方法(缓存音乐异或解密_音乐解密的解密设定-CSDN博客,原理即将音频文件全部与“A3”——也就是网易云的“163”进行异或运算的加密),我们在此将全部内容与“A1”进行异或:

image-20240826150858173

保存后播放音频听到flag内容

考点:理解音频的异或加密方式

[MRCTF2020]Unravel!!(新工具)

下载文件,里面是一张png图片、wav音频和一个加密的压缩包,我们优先对图片进行分析

按照图片隐写思路,第一步无果,我们优先使用010 editor进行分析,发现了插入隐藏的png图片:

image-20240826151702719

我们进行文件分离,得到了png图片:

image-20240826151809914

这并不是加密压缩包的密码,我们继续分析

我们分析分离的png图片,发现了插入隐藏的zip文件:

image-20240826151924779

分离zip文件,发现还是分离的png图片,但文件名给出提示“aes.png”

image-20240826152156682

看似没有别的线索了,我们再对音频进行分析

第一步无果,我们优先使用010 editor进行分析,发现了插入隐藏的信息:

image-20240826152412389

根据之前的提示,我们推测这是aes加密的内容(U2FsdGVkX1的开头)

我们进行解密:

image-20240826152817349

这是zip文件的密码,我们解压得到了新的wav音频文件,我们进行分析

按照音频隐写思路,第一步、第二步、第三步无果,我们开始使用特殊工具进行解密,steghide无果,我们继续搞

SilentEye——音频隐写的巨头

SilentEye 是一种基于图像和音频的隐写工具,主要用于将信息隐藏在图片和音频文件中。它提供了一种简单而有效的方式来嵌入和提取隐秘数据,而不会对文件的外观或音质造成明显影响。

我们使用SilentEye进行解密,得到了隐藏的flag:

image-20240826153548884

考点:

[GKCTF 2021]excel 骚操作(脑洞大开)

下载文件,是一个excel文件

我们打开,发现以下内容:

image-20240826160356382

什么都没有吗?我们随便点点,发现还是有些格子有内容的:

image-20240826160507569

为什么有内容却没有显示呢?原因是单元格格式被设置为自定义格式,且自定义格式使用了不可见字符,文本可能不会显示出来。

我们选中大部分表格内容,修改单元格格式:

image-20240826160608551

image-20240826160853918

我们可以发现数字1貌似在有规律的排列,我们对这些表格进行填充看看是什么图形:

image-20240826160933477

image-20240826161508609

image-20240826161443458

再修改下表格的宽高就能得到更好的图片:

image-20240826161628479

这并不是我们常用的二维码,这个叫汉信码

汉信码

汉信码是中国物品编码中心研发的一种二维码码制,现已成为国际二维码标准之一。

我们使用在线网站(在线汉信码识别,汉信码解码 - 兔子二维码 (tuzim.net))进行识别得到flag:

image-20240826162038626

考点:理解excel文件隐藏信息的方式、知道汉信码

[MRCTF2020]pyFlag(知识巩固题)

下载文件,发现里面是三张jpg图片,我们一个个进行分析

按照图片隐写思路,第一步无果,我们优先使用010 editor进行分析:

image-20240826163126386

可以发现三张图片都含有插入隐藏的文件,并且将文件拆成了三部分,我们手动分离并且拼接,得到了个加密的压缩包:

image-20240826163746581

我们发现里面的内容也没有经过伪加密,我们只好进行爆破,得到了解压密码:

image-20240828091813304

image-20240828091908784

得到了经过编码后的flag,如果只是编码而不是加密的话我们可以使用cyberchef的magic功能直接自动识别得到flag:

image-20240828092004260

考点:图片插入隐藏信息提取、压缩包密码爆破、多重编码内容解码

[UTCTF2020]File Carving(知识巩固题)

下载文件,是一张png图片

按照图片隐写思路,第一步无果,我们优先使用010 editor进行分析,得到插入隐藏的zip文件:

image-20240828112124593

提取解压得到了名为“hidden_binary”的没有后缀名的文件,我们使用010 editor打开进行分析:

image-20240828112211786

原来是ELF可执行文件,我们使用linux系统直接执行即可得到flag

考点:图片插入隐藏信息提取、理解ELF文件

[watevrCTF 2019]Evil Cuteness

下载文件,是一张jpg图片

按照图片隐写思路,第一步无果,我们优先使用010 editor进行分析,得到插入隐藏的zip文件:

image-20240828112634055

提取解压得到了名为“abc”的没有后缀名的文件,我们使用010 editor打开进行分析直接得到了flag

考点:图片插入隐藏信息提取

二维码(耐心)

下载图片,一看就是要我们手动拼接二维码……

image-20240828112844073

这就是个耗力气的活,原理咱都懂,那就只好拿出图片修改工具了:

image-20240828150810748

扫出flag

考点:耐心

[QCTF2018]X-man-A face(简单)

下载文件,是一张图片,又是一题二维码修复

image-20240828151344463

我们把二维码的定位符填上,即可得到一串密文:

KFBVIRT3KBZGK5DUPFPVG2LTORSXEX2XNBXV6QTVPFZV6TLFL5GG6YTTORSXE7I=

使用cyberchef直接解码出flag

考点:二维码修复

派大星的烦恼(脑洞大开)

下载文件,是一张bmp格式的图片

按照图片隐写思路第一步无果,我们优先使用010 editor进行分析:

image-20240828152448400

BMP文件格式简介

BMP格式的文件从头到尾依次是如下信息:

  • bmp文件头(bmp file header):共14字节;
  • 位图信息头(bitmap information):共40字节;
  • 调色板(color palette):可选;
  • 位图数据;

详情参考文章:BMP格式详解_bmp头部信息-CSDN博客

我们根据提示0xf0是派大星的赘肉(调色板的粉色像素内容),在中间发现了派大星的疤痕(0x22、0x44):

image-20240828152805409

(很容易往摩斯电码方向去思考,一定要按照题目提示做题)

我们将疤痕的数据提取出来:

"DD"DD""""D"DD""""""DD"""DD"DD""D""DDD""D"D"DD""""""DD""D""""DD"D"D"DD""""D"DD""D"""DD"""""DDD""""D"DD"""D"""DD"""D""DD"D"D"DD"""DD""DD"D"D""DD""DD"DD"""D"""DD""DD"DD""D"D""DD"D"D"DD"""D"""DD"""D"DD""DD"""DD"D"D""DD"""D"DD""DD""DD"""""DDD""DD""DD"""D""DD""

伤痕仅由两种字符组成,我们就应该向只有两种字符组成的加密方式进行思考

二进制编码

我们将"和D转换成1和0后进行转码结果是乱码:

image-20240828153348539

image-20240828153653388

摩斯电码

没有分割符所以暂时不考虑

培根密码

image-20240828154305927

image-20240828154322731

这时候我们应该想到:题目名“派大星的屁股“,那么密文是反着来的,我们应该逆序再试试看!

image-20240828153707689

成功得到32位的字符串!提交了还不是flag,怎么回事?

我们看看疤痕组成的二进制,确实有32位字符

01101100 00101100 00001100 01101100 10011100 10101100 00001100 10000110 10101100 00101100 10001100 00011100 00101100 01000110 00100110 10101100 01100110 10100110 01101100 01000110 01101100 10100110 10101100 01000110 00101100 11000110 10100110 00101100 11001100 00011100 11001100 01001100

那么我们可以这样逆序:将每一个字符的二进制段进行逆序

00110110 00110100 00110000 00110110 00111001 00110101 00110000 01100001 00110101 00110100 00110001 00111000 00110100 01100010 01100100 00110101 01100110 01100101 00110110 01100010 00110110 01100101 00110101 01100010 00110100 01100011 01100101 00110100 00110011 00111000 00110011 00110010

我们可以使用以下脚本实现这个功能

a = "0110110000101100000011000110110010011100101011000000110010000110101011000010110010001100000111000010110001000110001001101010110001100110101001100110110001000110011011001010011010101100010001100010110011000110101001100010110011001100000111001100110001001100"
b = ''

# 将字符串按每8位进行分组并进行倒序
for i in range(0, len(a), 8):
    segment = a[i:i+8]  # 提取每8位的分组
    reversed_bin = segment[::-1]  # 将这8位倒序
    b += reversed_bin  # 将倒序后的结果添加到输出字符串中

print(b)

image-20240828164305233

得到正确的flag

考点:理解bmp图片文件格式、两种字符组成的加密方式、脑洞大开

(吐槽:到了最后我也没发现是谁打了派大星啊?)

[INSHack2017]sanity

下载文件,md格式的文本,打开就给flag

考点:会打开md格式的文件

key不在这里

下载文件,是一张二维码,我们优先扫描:

image-20240828164903226

弹出了一个网页链接,是使用bing引擎搜索“key不在这里”的链接

image-20240828165110866

https://cn.bing.com/search?q=key不在这里
&m=10210897103375566531005253102975053545155505050521025256555254995410298561015151985150375568
&qs=n
&form=QBRE
&sp=-1
&sc=0-38
&sk=
&cvid=2CE15329C18147CBA4C1CA97C8E1BB8C

q 这是最重要的参数,用于传递搜索查询的关键词。这里q的值是 key不在这里,这就是你输入的搜索词。

qs 代表 "Query Suggestion",用于控制搜索建议的行为。n 表示禁用建议。

form 这是一个标识符,用于指示搜索请求的来源。QBRE 表示标准的搜索请求表单。

sp 表示搜索阶段或流程控制。-1 表示禁用自动完成功能。

sc 这个参数可能与搜索结果的精确性和建议有关,0-38 表示39个字符的查询词,可能有8个相关的建议。

sk 这是一个控制参数,通常与用户输入相关联。在这个URL中,它为空,表示未使用。

cvid 表示 "Client Version ID",是用于标识当前会话的唯一ID,可以帮助Bing跟踪和优化用户的搜索体验。

其实我们也一眼就能看出来m参数不对劲,分析一下其中的密文特征:纯数字并且没有分段,有经验的同学看开头“102 108 97 103”就能看出来是“flag”的ascii码了

我们提取出来放到cyberchef进行解密得到flag:

image-20240828170130454

这里也提供脚本:

def decode_ascii(number_string):
    decoded_string = ""
    i = 0
    while i < len(number_string):
        # 尝试读取2位和3位的可能性
        if i + 2 <= len(number_string):
            two_digit = int(number_string[i:i+2])
            if 32 <= two_digit <= 126:  # 有效ASCII范围
                decoded_string += chr(two_digit)
                i += 2
                continue
        
        if i + 3 <= len(number_string):
            three_digit = int(number_string[i:i+3])
            if 32 <= three_digit <= 126:  # 有效ASCII范围
                decoded_string += chr(three_digit)
                i += 3
                continue

        # 如果没有有效字符,则跳过该位(错误处理)
        i += 1

    return decoded_string

number_string = "10210897103375566531005253102975053545155505050521025256555254995410298561015151985150375568"
decoded_message = decode_ascii(number_string)
print(decoded_message)

考点:对相关密码的敏感

粽子的来历(脑洞大开)

下载文件,是四个doc文件并且都打不开

我们使用010editor进行分析,发现了奇怪的字符串:

image-20240828171525378

可能就是在OleHeader(文件头)中出现这些导致了文件损坏,我们进行修复即可(都改成FF)

我们打开ABCD四个文件,发现都是一样的内容,但行距好像有些区别:

image-20240828172020940

image-20240828172030554

我们仔细查看,这些诗句之间的行距有的为1,有的为1.5

image-20240828172412440

image-20240828172437137

我们对全诗进行统计,统计出所有诗句之间的行距

这里给出AI帮我写的脚本:

import os
from docx import Document
import pythoncom
from win32com import client as win32


# 将 .doc 文件转换为 .docx 格式
def convert_doc_to_docx(doc_path):
    doc_path = os.path.abspath(doc_path)
    if not os.path.exists(doc_path):
        raise FileNotFoundError(f"文件 {doc_path} 不存在。")

    pythoncom.CoInitialize()
    word = win32.Dispatch("Word.Application")
    doc = word.Documents.Open(doc_path)
    docx_path = doc_path.replace(".doc", ".docx")
    doc.SaveAs(docx_path, FileFormat=16)
    doc.Close()
    word.Quit()
    return docx_path


# 从 .docx 文件中提取每段的行距信息
def extract_line_spacing(docx_path):
    document = Document(docx_path)
    line_spacing_info = []
    for para in document.paragraphs:
        # 仅在段落有内容时提取行距信息
        if para.text.strip():
            if para.paragraph_format.line_spacing:
                line_spacing = para.paragraph_format.line_spacing
                line_spacing_info.append(f"文件: {os.path.basename(docx_path)} - 行距: {line_spacing}")
            else:
                line_spacing_info.append(f"文件: {os.path.basename(docx_path)} - 行距: 默认")
    return line_spacing_info


# 将提取的行距信息写入到指定的文本文件中
def write_to_file(output_file, line_spacing_info):
    with open(output_file, 'a') as file:
        for line in line_spacing_info:
            file.write(line + '\n')


if __name__ == "__main__":
    input_files = ["我是A.doc", "我是B.doc", "我是C.doc", "我是D.doc"]  # 需要处理的 .doc 文件列表
    output_file = "1.txt"  # 输出行距信息的文本文件名

    try:
        all_line_spacing_info = []

        for input_file in input_files:
            docx_file = convert_doc_to_docx(input_file)
            line_spacing_info = extract_line_spacing(docx_file)
            all_line_spacing_info.extend(line_spacing_info)
            os.remove(docx_file)  # 清理:删除临时生成的 .docx 文件

        write_to_file(output_file, all_line_spacing_info)
        print(f"所有文件的行距信息已成功写入 {output_file}")

    except Exception as e:
        print(f"发生错误: {e}")

image-20240828180753340

这貌似又是某种规律,由两种字符组成的密码

二进制

无论是将“1.5”设为1、“默认”设为0还是将“1.5”设为0、“默认”设为1,都是乱码

摩斯电码

没有分隔符不考虑

培根密码

也都是乱码

后来看了其他人的write up,发现是题目提示不够明显:

正确的方法是逐一尝试,将得到的每个文件的10组合进行MD5加密,“我是C.doc”文件得出的10组合的MD5值就是flag

考点:脑洞大开

[MRCTF2020]不眠之夜(新工具)

下载文件,一大堆jpg图片,图片宽度和高度相等,一眼就看出来是拼图题,这里我们就是用montage和gaps工具进行自动拼图吧

montage

Montage 是一个在 Unix/Linux 系统上广泛使用的命令行工具,它是 ImageMagick 工具套件的一部分,用于处理图像。Montage 主要用于将多张图像拼接成一张大图,通过指定的布局和设置将这些图像排列在一起。

我们进入含有所有图片的路径下,输入命令:

montage *jpg -tile 10x12 -geometry +0+0 flag.jpg

-tile 设置拼接后的图像布局方式,10x12表示10行12列(我们先尝试拼接得出行和列)

-geometry 用于指定图像的大小和位置,+0+0指定每个图像之间的间距,即图像相对位置的偏移量,第一个+0表示水平方向上图像之间的间距为 0 像素,第二个+0表示垂直方向上图像之间的间距为 0 像素

image-20240828193918070

接下来我们使用gaps工具进行自动拼接

gaps工具

详情可以查看nemanja-m/gaps: A Genetic Algorithm-Based Solver for Jigsaw Puzzles 🌀 (github.com)里面有工具介绍和安装方式

安装好后,我们将输出的flag.jpg放到gaps目录中,使用以下命令:

gaps run flag.jpg tureflag.jpg --generations=40 --population=120 --size=200

--image 指定输入拼图图片

--generationgs 遗传算法的代的数量,最好等于原始图片的数量

--population 个体数量

--size 拼图块的像素尺寸,gaps识别的拼图都是正方形的,我们原图的拼图是长方形的,论尺寸刚好可以分成两个正方形,则gaps识别的拼图size=200/2=100(看文件属性宽度为200)

image-20240828194117783

得到了flag

考点:学会使用montage和gaps工具进行拼图

大流量分析(一)(新)

下载文件,是一堆pacp流量包

仔细读题,这道题目是一个问答题:黑客的攻击ip是多少?那么这次我们需要做的就不是协议分级了

wireshark功能七——会话统计和端点统计

我们先打开第一个流量包,进入会话统计,查看根据ipv4协议的会话,按照packet A->B排序查看哪个IP发送的数据包最多:

image-20240828191925957

image-20240828192154321

可以看到前几名ip发送了超过一万条的数据包,我们先不要下定论,再看看端点统计的内容。按照Tx packets排序查看哪个发送方发出的数据包最多:

image-20240828192339082

image-20240828192142202

可以发现183.129.152.140这个ip再一次出现,因此我们可以推测黑客的ip就是183.129.152.140,即为flag

考点:会话统计和端点统计

hashcat(较难新工具)

下载文件,是一个打不开的没后缀文件,我们使用010 editor进行分析:

image-20240828194422821

其中发现了office 2006的字符串,推测这是office办公软件文件,我们尝试给它加上.doc后缀:

image-20240828194738010

打开发现文件被加密了(之前010 editor中看到的字符串也含有加密的一些信息),按照题目提示我们应该使用hashcat工具进行解密,什么是hashcat?

hashcat

Hashcat 是一款功能强大且高效的密码破解工具,专门用于破解散列值(hashes),是一个广泛用于密码审计和恢复的工具,但它在处理速度和支持的散列算法种类上有着明显的优势。

既然我们要用hashcat来破解出doc文件的密码,那么我们首先就需要得到doc文件的hash值,我们可以使用john工具来获取doc文件的hash值

john the ripper

也是一个广泛使用的密码破解工具,主要用于检测密码强度和恢复遗忘的密码。它可以通过多种方法进行密码破解,包括字典攻击、暴力攻击和基于规则的攻击。

一般下载了john就会自动拥有john工具包(将文件转换成john能够识别的hash值)比如我们在此可以使用这个命令输出doc文件的hash值:

office2john	What\ kind\ of\ document\ is\ this_.doc

image-20240828195846121

$office$*2010*100000*128*16*265c4784621f00ddb85cc3a7227dade7*f0cc4179b2fcc2a2c5fa417566806249*b5ad5b66c0b84ba6e5d01f27ad8cffbdb409a4eddc4a87cd4dfbc46ad60160c9

我们保存doc的hash值至1.txt中然后打开example_hashes hashcat wiki这个网站查找相关文件的哈希算法

image-20240828200407380

那么对应的哈希算法编号就是9500

再准备一个密码字典我们就可以直接开始了(这里用的是纯数字密码字典,从0~999999六位纯数字密码,因为CTF题目一般爆破密码都是纯数字密码)

# 打开或创建 number.txt 文件,模式为写入模式
with open("number.txt", "w") as f:
    # 使用循环生成 0 到 999999 的所有数字
    for i in range(1000000):
        # 将数字写入文件,每个数字一行
        f.write(f"{i}\n")

那么我们可以使用以下命令:

hashcat -m 9500 -a 0 -o cracked.txt 1.txt number.txt

-m 指定哈希算法

-a 指定攻击方式,0表示使用字典攻击

-o 表示将破解结果保存到这个文件中

稍等片刻,从输出的文件中得到了密码9919:

image-20240828203046940

尝试打开doc文件发现出错,可能它并不是doc文件,我们修改成xls、ppt,最后发现它是ppt文件

我们打开文件,找到了隐藏的白色flag(更改字体颜色)

image-20240828203222189

考点:会使用hashcat和john工具包

[UTCTF2020]sstv(新工具)

下载文件,是一个wav的文件,听上去全是电磁的杂音

这其实是一个非常有趣的图像传输方式sstv,可以看看这个视频的科普: https://www.bilibili.com/video/BV1Vb421779F/?share_source=copy_web&vd_source=69c558b0c7be97607c79afbd75bd1f7c

SSTV

SSTV(Slow Scan Television,慢扫描电视)是一种用于在业余无线电频段内传输静态图像的通信方式。与传统电视信号的高速扫描方式不同,SSTV 以较低的速率逐行传输图像,因此得名“慢扫描电视”。

发送端: 在发送端,静态图像被逐行扫描并转换为音频信号。这些音频信号通过无线电发射机发送出去。

接收端: 在接收端,接收的音频信号通过解码软件或硬件解码器转换回图像。最终,接收者能够看到发送的图片。

为了识别这种声音信号,我们使用软件MMSSTV

MMSSTV

MMSSTV 是一种用于接收和发送慢扫描电视(SSTV)信号的计算机软件。它专门设计用于在业余无线电操作中处理 SSTV 图像。MMSSTV 是一个流行的 SSTV 软件,广泛应用于无线电爱好者社区。

下载软件,打开后直接播放音频即可得到flag:

image-20240829121157665

考点:理解SSTV

voip

下载文件,发现里面是一个pcap格式的文件,我们使用wireshark打开查看:

image-20240828211445857

按照数据包分析思路,我们先进行协议分级:

image-20240828211519706

这一回最多的是基于UDP协议的RTP协议,这是什么协议?

UDP协议

UDP(User Datagram Protocol,用户数据报协议)是一个无连接的通信协议,属于互联网协议套件中的传输层协议。与 TCP(Transmission Control Protocol,传输控制协议)相比,UDP 是一种更加轻量级的协议,主要用于需要快速传输但对可靠性要求不高的场景(如视频通话)。

RTP协议

RTP 是一种网络传输协议,用于在实时通信中传输音频和视频数据。RTP 通常与 SIP 配合使用,负责实际的媒体数据传输。

那么我们可以推测这个流量包包含了实时通信的数据,按照题目名voip我们可以知道这些协议都在给voip技术提供服务

voip技术

VoIP(Voice over Internet Protocol)是指通过互联网协议(IP)进行语音通信的技术。简单来说,VoIP使得语音信号可以通过互联网或其他基于IP的网络进行传输,而不是通过传统的电话线路(PSTN)。

wireshark功能八——电话voip通话解析

我们可以使用wireshark提取通话中的音频流:

image-20240828220648557

image-20240828221049716

直接播放音频,考验听力,把flag输出来就好了

考点:理解UDP协议、理解voip技术、会使用wireshark的电话功能

[SCTF2019]电单车(较难新)

下载文件,是一个wav格式的音频文件,我们听一下,只有一秒并且只有“滋”的一声

按照音频隐写思路我们优先使用Audacity观察音频是否藏有信息:

image-20240829092151695

我们尝试一下,发现并不是摩斯电码,我们转换成二进制

0	0111010010101010011000100	011101001010101001100010

尝试转换也不是二进制,但我们发现了一个规律,那就是它隐藏的信息应该是发送了两次的

0	011101001010101001100010

根据题目名电单车,我们可以推测这信号与无线射频信号有关系,并且与电单车的防盗或遥控功能有关。

1. PT2262/2272 系列

  • 信号格式:PT2262编码器生成的信号是一个串行的脉冲序列,通常包含12位或24位地址码和4位或8位数据码。
  • 编码格式
    • 每一位由3个脉冲组成,表示逻辑"1"、"0"或"浮动"状态。
    • 地址码用于识别发射器和接收器的配对,数据码则传输按键的状态(如锁车、解锁)。
  • 脉冲宽度:信号通过宽度调制(PWM)进行传输,不同的脉冲宽度代表不同的逻辑状态。

2. HT12E/HT12D 系列

  • 信号格式:HT12E编码器发出的信号包括12位地址码和4位数据码,共16位数据。
  • 编码格式
    • 每位信号通过脉冲的宽度和时间间隔来表示逻辑“1”和“0”。
    • 地址码与数据码依次发送,形成一个完整的数据包。
  • 脉冲宽度:同样是PWM调制,不同的脉冲宽度表示不同的逻辑位。

3. 滚动码(Rolling Code)技术

  • 信号格式:滚动码系统(如HCS301)采用动态的编码技术,每次信号传输的码值都会改变。
  • 编码格式
    • 通常包括加密后的序列号、功能码、计数器值以及唯一的密钥。
    • 传输的数据包由固定的前导码、滚动码、功能码组成。
  • 安全特性:由于信号每次变化,这种技术能有效防止信号重放攻击。

4. ASK/OOK(Amplitude Shift Keying / On-Off Keying)

  • 信号格式
    • ASK:通过调制载波信号的振幅来表示二进制数据“1”和“0”。
    • OOK:是ASK的特例,当振幅完全关闭时表示“0”,打开时表示“1”。
  • 调制方式:信号的振幅改变用于传输数据,振幅越高表示“1”,越低表示“0”。
  • 应用:多用于简单的无线通信,如遥控器。

5. FSK(Frequency Shift Keying)

  • 信号格式:FSK通过改变载波信号的频率来表示二进制数据。
  • 编码格式
    • 不同的频率代表不同的逻辑状态,通常高频代表“1”,低频代表“0”。
  • 调制方式:频率的切换速度可以根据通信要求进行调整,适用于需要较高抗干扰能力的通信系统。

6. 红外信号

  • 信号格式:红外遥控器信号通常以脉冲编码形式传输。
  • 编码格式
    • 常见的是NEC编码,包含前导码、地址码、命令码和校验码。
    • 每一位通过不同长度的高低电平脉冲表示“0”或“1”。
  • 脉冲宽度:通常在38 kHz载波频率下工作,脉冲宽度决定编码信息。

7. 蓝牙低功耗(BLE)

  • 信号格式:BLE使用的信号格式基于GFSK(Gaussian Frequency Shift Keying)调制技术。
  • 编码格式
    • 数据通过频率的高斯调制表示,BLE的信号格式包括访问地址、PDU(Protocol Data Unit)和CRC校验。
  • 传输速率:BLE通常在2.4 GHz频段工作,传输速率可以达到1 Mbps。

8. NFC(近场通信)

  • 信号格式:NFC使用的信号格式基于ASK调制技术。
  • 编码格式
    • NFC标签的信号包含前导码、UID(唯一标识符)、命令和数据帧。
    • 数据通过振幅的变化进行传输。
  • 工作频率:通常在13.56 MHz频段工作,传输速率较低,适合近距离通信。

9. RFID(射频识别)

  • 信号格式:RFID信号格式因标签类型不同而有所变化,常见的有ISO 14443和ISO 15693标准。
  • 编码格式
    • 数据通常通过ASK或PSK(Phase Shift Keying)调制传输,包含UID、数据和校验位。
  • 工作频率:常见的工作频率为125 kHz、13.56 MHz或900 MHz,适合不同的应用场景。

10. Zigbee

  • 信号格式:Zigbee使用的信号格式基于DSSS(Direct Sequence Spread Spectrum)和O-QPSK(Offset Quadrature Phase Shift Keying)调制技术。
  • 编码格式
    • 数据包通常包含前导码、地址、帧控制、数据负载和CRC校验码。
  • 传输速率:通常工作在2.4 GHz频段,传输速率在20 kbps到250 kbps之间,适用于低速率低功耗的无线通信。

我们可以发现信号由三种脉冲组成,“0”、“1”和“浮动”三种状态,符合PT2242信号格式,开始分析:

[同步码] -> [地址码] -> [数据码] -> [结束码(可选)]

同步码:同步码通常是一个长时间的高电平脉冲,后跟一个低电平脉冲。这个长脉冲用于引起接收器的注意,使其进入数据接收状态。4bit

地址码:PT2242发送的信号包括20位地址码

数据码:后跟4位数据码,代表按键的状态。

0		01110100101010100110	0010
同步码	  地址码					数据码






参考文章:https://www.onctf.com/posts/dda8f4cb.html

参考文章:攻防世界高手区9(73-78) (demonstaralgol.github.io)发现原题应该还有一段提示:截获了一台电动车的钥匙发射出的锁车信号,3分钟之内,我要获得它地址位的全部信息

也就是说我们的flag应该是这条信号的地址码

考点:理解无线射频信号原理

[GUET-CTF2019]soul sipse(知识巩固题)

下载文件,是一个wav格式的音频文件,我们听一下,没有什么声音

按照音频隐写思路我们第二步无果,我们使用010 editor打开文件也无法看出插入隐藏,我们使用binwalk查看其中的插入隐藏信息:

image-20240829101746879

binwalk提取不出来,我们使用foremost提取:

image-20240829101801506

foremost也提取不出来,那么我们只能推测是使用了特殊工具了

steghide

steghide extract -sf out.wav

分离出了文件download.txt

image-20240829105016912

得到了一个网址,尝试下载文件image-20240829105051092

这题目已经过期了。。。那么只能看别人的wp了:

image-20240829105219574

参考文章:misc刷题记录 - carefree669 - 博客园 (cnblogs.com)

考点:音频隐写、打开脑洞猜测flag的值

[UTCTF2020]spectogram(新)

下载文件,是一个wav的文件,听上去全是电磁的杂音

按照音频隐写思路,我们优先使用Audacity进行分析,查看音频的频谱图即可得到flag:

image-20240829111120347

image-20240829111141698

频谱图

频谱图(Spectrogram)是一种表示信号(尤其是声音信号)随时间变化的频率成分的图像。它通过将一个信号分解成多个频率成分,并显示这些频率成分随时间的强度变化,帮助我们理解信号的频率内容和时间动态。通过观察频谱图,可以识别出音频信号中的不同频率成分,分析音乐的音高、语音的发音特征等。

考点:理解频谱图

蜘蛛侠呀(新工具)

下载文件,发现里面是一个pcap格式的文件,我们使用wireshark打开查看:

image-20240829112007375

按照数据包分析思路,我们先进行协议分级:

image-20240829112054376

我们可以发现应用层ICMP协议占比最高,应该优先分析。

ICMP协议

ICMP(Internet Control Message Protocol,互联网控制消息协议)是一种用于在网络设备之间发送控制消息的协议,通常用于诊断网络连接问题和传递错误消息。

如 Ping 工具使用 ICMP 的 "回显请求" 和 "回显应答" 消息来测试主机之间的连通性。源主机会发送 ICMP 回显请求到目标主机,目标主机会回复 ICMP 回显应答,源主机通过计算响应时间来判断网络状况。

ICMP 协议是 TCP/IP 协议栈中的一部分,主要与 IP 协议一起使用。

image-20240829112424424

我们可以发现ICMP数据包中都写有Data字段,我们使用tshark进行提取:

tshark -r out.pcap -Y "icmp" -T fields -e data > data.txt

image-20240829112702073

可以发现有很多重复数据,我们使用notepad++进行去重操作(使用正则表达式进行替换或者是使用插件TextFX):

^(.*?)$\s+?^(?=.*^\1$)

一眼十六进制,我们转换为字符串查看:

image-20240829113357575

提取出了很多东西,我们再把前方“$$START$$”字符串删除后进行观察:

image-20240829113724593

有个等号,推测经过了base64编码,放到cyberchef里面看看:

image-20240829113809599

得到了个zip文件,我们提取解压得到了个gif文件:

image-20240829114040194

我们看gif图片宽高非常不匹配,我们尝试修改图片的高度,但图片还是原样,因此这里不存在宽高相关的隐藏:

image-20240829114154627

这里涉及到gif的一种新的隐写方式:时间轴隐写

我们可以观察gif文件以下内容:

Data->GraphicControlExtension[0]->GraphicControlSubBlock->DelayTime
数据->图形控制扩展结构->图形控制数据块->延时时间

image-20240829115348725

可以看出第一张图片延时时间为20/100=0.2s,第二张图片延时时间为50/100=0.5s……而所有图片的延时时间就只有这两种情况,聪明的同学就已经能猜到这含有某种只包含两种字符的加密方式了

identify

identify 是 ImageMagick 软件包中的一个命令行工具,用于显示图像文件的各种信息和属性。ImageMagick 是一个开源软件套件,支持多种图像处理功能,如转换、编辑、组合等,广泛应用于图像处理领域。

我们使用以下命令即可提取gif文件的动画帧的延迟时间

identify -format "%T" flag.gif

-format 用于指定输出的格式,这里%T是一个格式化标记,用来提取 GIF 动画中每一帧的延迟时间

image-20240829120357368

我们将输出进行替换,将20替换为0,50替换为1,二进制转码得到字符串,按照题目提示进行MD5加密后得到flag:

image-20240829120612460

考点:理解ICMP协议、理解gif时间轴隐写

[安洵杯 2019]easy misc(新孬题)

下载文件,是一个包含许多txt文件的文件夹、一个加密的压缩包、一个png图片

我们优先分析png图片,按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240830104914644

发现了隐藏插入的png图片,我们文件分离提取:

image-20240830110836239

是两张一模一样的图片,我们对提取出的图片进行分析。

按照图片隐写思路,第一步、第二步、第三步无果,使用了zsteg、cloacked-pixel无果后,我们优先查看其中是否存在盲水印

盲水印

盲水印隐写是一种信息隐藏技术,主要用于在数字媒体(如图像、音频、视频)中嵌入不可见的水印信息。它的关键特性在于,水印信息的提取不需要原始未嵌入水印的文件作为参考,这就是所谓的“盲”水印。以下是其基本原理:

  1. 嵌入过程:盲水印隐写通过对载体文件(如图片、音频等)进行微小的修改,将水印信息嵌入其中。这种修改通常在载体的某些特征(如图像的频率域、空域)中进行,使得嵌入后的文件与原始文件在视觉或听觉上几乎没有差别。
  2. 鲁棒性:嵌入的水印应具有鲁棒性,能够在载体文件遭受一些常见操作(如压缩、裁剪、噪声干扰等)后仍然能被检测到。
  3. 提取过程:提取水印时,不需要原始载体的帮助。通过检测嵌入水印时所用的规则和算法,从修改后的载体中恢复出水印信息。
  4. 应用场景:盲水印技术常用于版权保护、文件完整性验证等场合,确保文件的合法性并防止篡改。

这种技术的核心挑战在于在不影响载体质量的前提下,确保水印信息的鲁棒性和隐蔽性。

盲水印可以使用相关工具进行信息加密和解密,并且不同的脚本使用的加密和解密方式不同(一般看题目来)

在此我们使用github开源的BlindWaterMark-master(https://github.com/chishaxie/BlindWaterMark)进行解密:(我对图片文件名进行了更改)

python2 bwm.py decode 123.png 456.png out.png

我们提取出了盲水印的内容:

image-20240905180606779

看得出来是希望我们关注11.txt中的内容

我们接着分析decode.zip文件,我们发现它存在注释:

image-20240905170148669

我们可以推测((√2524921X85÷5+2)÷15-1794)+NNULLULL,为decode.zip的密码提示,但前面的式子存在未知数X咱们也不知道答案,那么我们可以进行掩码爆破可以得到正确的密码(这里有坑,字符串中的“,”也包含在密码中):

image-20240905172356116

解压decode.zip得到下一个提示:

image-20240905172506089

貌似是解码提示,那么我们继续分析read文件夹,我们先看其中的提示hint.txt:

image-20240905172621823

重点分析其中的11.txt:

image-20240905172702377

我们试着提取前16个字符“HarryPotterandth”我们可以编写脚本进行对照:

# 替换映射表
mapping = {
    'a': 'dIW', 'b': 'sSD', 'c': 'adE', 'd': 'jVf', 'e': 'QW8',
    'f': 'SA=', 'g': 'jBt', 'h': '5RE', 'i': 'tRQ', 'j': 'SPA',
    'k': '8DS', 'l': 'XiE', 'm': 'S8S', 'n': 'MkF', 'o': 'T9p',
    'p': 'PS5', 'q': 'E/S', 'r': '-sd', 's': 'SQW', 't': 'obW',
    'u': '/WS', 'v': 'SD9', 'w': 'cw=', 'x': 'ASD', 'y': 'FTa',
    'z': 'AE7'
}

def replace_string(input_string):
    result = []
    for char in input_string:
        # 如果字符存在于映射表中,则进行替换
        if char in mapping:
            result.append(mapping[char])
        else:
            result.append(char)  # 如果字符不在映射表中,保留原字符
    return ''.join(result)

# 测试
input_string = input("请输入要替换的字符串: ")
output_string = replace_string(input_string)
print("替换后的字符串:", output_string)

得到“HdIW-sd-sdFTaPT9pobWobWQW8-sddIWMkFjVfobW5RE”,提交发现不是flag

“取前16个字符”到底是什么意思?我们使用puzzlesolver逐一尝试分析前16个字符的含义:

image-20240906142139840

取前16个字符:“ etaonrhisdluygw”或者“etaonrhisdluygwm”(若空格不计)

我们可以得到:“QW8obWdIWT9pMkF-sd5REtRQSQWjVfXiE/WSFTajBtcw=”或者“QW8obWdIWT9pMkF-sd5REtRQSQWjVfXiE/WSFTajBtcw=S8S”

二者都不是flag,看了下别人的WP,这道题目出错了:

d3ad410860c48f05a1ce488922837e99

若按照题目来的话,我们得到的前16位字符应该为“etaonrhsidluygw”,这里顺序出错了

考点:文件分离、理解盲水印、压缩包密码掩码爆破、字频统计

Business Planning Group(新工具知识巩固题)

下载文件,一张png格式的图片

按照图片隐写思路,第一步无果,我们优先打开010 editor打开图片查看:

image-20240906165308120

我们可以发现插入隐藏的BPG图片

BPG图片

BPG(Better Portable Graphics)是一种图像格式,旨在取代JPEG,提供更好的图像质量和更高的压缩率。BPG 文件基于 HEVC (High Efficiency Video Coding) 视频编码技术,能够在相同的文件大小下提供更好的细节和颜色表现。其主要优点包括:

  1. 高压缩率:BPG 比 JPEG 更有效地压缩图像,同时保持较高的图像质量。
  2. 支持透明度:BPG 支持透明背景(alpha 通道),而标准的 JPEG 不支持。
  3. 广泛的色彩支持:BPG 支持更广的色彩空间(如 10 位或 12 位色深),更适合高品质图像。

由于 BPG 不是常见的图像格式,默认情况下大多数操作系统或图像查看器无法直接打开它在此我们使用工具Honeyviewer查看图片

Honeyviewer

Honeyview 是一款轻量级、快速的图片查看器,主要用于查看多种格式的图像文件。

image-20240906204536452

我们可以看到其中的密文,我们敲出来进行解码:

image-20240906214458804

考点:文件分离、理解BPG图片

[GKCTF 2021]你知道apng吗

下载文件,是一个APNG格式的文件

APNG

APNG(Animated Portable Network Graphics)是一种增强版的 PNG 图像格式,支持动画功能。与传统的 GIF 格式相比,APNG 能够提供更高质量的图像和更丰富的颜色深度,且同样支持透明背景(alpha 通道)。它在外观上与普通 PNG 文件相同,未被浏览器支持的情况下,会显示为静态的 PNG。

我们可以使用上一题使用的Honeyview来查看图片的内容,我们可以发现这动图有几帧藏着二维码:

image-20240906215540566

image-20240906220749164

image-20240906215555713

image-20240906215621740

我们进行修复并扫码:

image-20240906215944465

image-20240906220837927

image-20240906220021853

image-20240906220040918

得到了flag

考点:理解apng图片、利用工具逐帧查看apng文件图像

greatescape

下载文件,发现里面是一个pcap格式的文件,我们使用wireshark打开查看:

image-20240719105205157

按照数据包分析思路,我们先进行协议分级:

image-20240719105322791

我们发现TCP协议占比最高,并且使用了TLS协议加密(Transport Layer security)占比的内容很多;协议中使用了FTP协议,优先查看FTP协议发了些什么文件,过滤FTP Data:

image-20240719105839980

发现是TLS加密的密钥,我们通过导出分组字节流保存为私钥文件(包的后边也提示了文件名为ssc.key)

这里HTTP协议的内容已被加密:

image-20240719110650750

因此我们需要导入我们获得的私钥文件进行解密:

image-20240719110801954

image-20240719111157031

在edit里面添加私钥文件:

image-20240719111247365

解密后我们直接摸鱼搜索”FLAG“字符串:

image-20240719111923314

得到了flag。

考点:网络流量分析、理解SSL/TLS密码通信框架、学会使用wireshark导入私钥文件

[湖南省赛2019]Findme(较难知识巩固题)

下载文件,内容为5张png格式的图片,我们从1.png开始分析

按照图片隐写思路,第一步我们使用tweakpng发现1.png的crc校验出现错误,因此可能存在PNG宽高隐写:

image-20240907144456826

并且还警告了我们十六进制从8237处出现了无效的chunk类型

image-20240907144529265

我们使用之前的脚本找出了1.png的正确宽高,我们使用010editor进行修改:

image-20240907144630196

image-20240907144709413

我们修改完成后,图片只修复好了一半:

image-20240907145153858

根据之前警告给出的错误,我们观察十六进制从8237处出现的无效的chunk类型:

image-20240907145244815

16进制中,21+200C=202D,转换成十进制刚好为8237

也就是说chunk[2]即是出现无效类型的地方,我们发现chunk[2]没有type,即IDAT标识,我们进行填补:

image-20240907145553901

image-20240907145630907

图片还是只修复了一点点,说明还是有地方出了问题,我们再将图片导入tweakpng中分析问题:

image-20240907145724665

这次警告说16441处出现了无效的chunk类型,我们在010editor中再次运行模板进行修复:

image-20240907145836254

发现这次是chunk[3]出现了问题,我们进行修复即可:

image-20240907145925639

图片修复完成,我们继续分析,第二步无果,我们优先使用stegsolve,发现在图像蓝色通道的第 2 位平面出现了隐藏的二维码:

image-20240907150255535

image-20240907150335310

得到了第一段经base64编码的flag

我们继续分析2.png,按照图片隐写思路,第一步无果,我们优先使用010editor进行分析:

image-20240907150516829

发现了插入隐藏的7z压缩文件,我们进行文件分离,发现7z文件打不开,我们再进行深入分析,发现7z的文件头为82 37 03 04,正确的7z文件头应该为,而题目中的文件头反而很像ZIP的文件头:50 4B 03 04,我们将分离的文件中所有的“7z”替换为“PK”

image-20240907151144547

成功打开zip压缩包,打开发现里面有很多txt文件,并且内容都是一样的:

image-20240907151326407

我们对压缩包中所有的txt文件进行大小排序啊,发现了隐藏的第二段经base64编码的flag:

image-20240907151418361

继续分析3.png,按照图片隐写第一步使用tweakpng后发现一堆crc数值报错:

image-20240907151827776

image-20240907151839105

image-20240907151850739

image-20240907151903276

image-20240907151931626

image-20240907151941834

image-20240907151952126

一次性这么多crc的值出错必定是暗藏玄机,我们将IDAT中的crc值进行输出发现了隐藏的第三段经base64编码的flag:

image-20240907152136643

我们继续分析4.png,第一步即在图片的exif信息中的艺术家那一栏发现了隐藏的第四段经base64编码的flag:

image-20240907152553473

我们继续分析5.png,第一步无果,第二步我们优先使用010editor进行分析,发现了第五段经base64编码的flag:

image-20240907152741171

我们将所有经base64编码的flag进行排列组合:

ZmxhZ3s0X3	解码为flag{4_,应放在第一个

1RVcmVfc	解不开

3RlZ30=	解不开,但结尾包含“=”,应放在最后一个

cExlX1BsY	解码为pLe_Pl

Yzcllfc0lN	解不开

有三个无法确定顺序,但经历一次次排列组合总能得到flag:

image-20240907153345563

考点:利用tweakpng、010editor、exiftool对图片进行分析

[ACTF新生赛2020]剑龙(新工具)

下载文件,打开是一个没有后缀的文件(使用010editor分析出应该为pyc文件)和一个提示的hint压缩文件,解压后查看内容:

image-20240907153855646

老朋友颜文字加密了,我们进行解密:

image-20240907153922683

记录下这个字符串,可能是密码

我们再继续分析图片,按照图片隐写思路在图片属性中发现了密钥:

image-20240907154015968

有密钥说明图片可能经过了需要密码的加密方式,我们优先使用steghide进行解密:

steghide extract -sf hh.jpg 

解密成功,使用的解密密码为welcom3!

提取出secret.txt:

image-20240907154329882

密钥为“@#$%^&%%$)”长度为10位,并且密文以“U2FsdGVkX1”开头,我们尝试使用DES解密成功(这里使用了离线工具enigmator):

image-20240907155052239

得到了线索stegosaurus

接下来我们分析pyc文件,首先使用工具将其进行反编译:

#!/usr/bin/env python
# visit https://tool.lu/pyc/ for more information
# Version: Python 3.6

from PIL import Image

def dtob(num):	#将一个十进制数转换为对应的二进制字符串。
    temp = bin(num).replace('0b', '')	#将数字 num 转换为二进制表示并移除前缀 0b
    length = len(temp)
    over = length // 8
    temp = temp.zfill((over + 1) * 8)	#将字符串补齐到最近的8位倍数
    return temp


def getSecret(mpath):	#读取指定文件(mpath)的内容,并将其逐字节转为二进制形式
    secret = ''
    file = open(mpath, 'rb')
    content = file.read()
    length = len(content)
    for i in range(length):
        tmp = content[i]
        tmp = dtob(tmp)	#调用 dtob() 函数,将每个字节转换为8位的二进制表示,最终将所有二进制数据拼接成一个字符串 secret
        secret += tmp
    
    return secret


def start(ppath, mpath, rpath):
    im = Image.open(ppath)	#打开图片 ppath 并加载像素数据 px
    px = im.load()
    message = im.size
    width = message[0]
    height = message[1]
    print(width, height)
    secret = getSecret(mpath)	#通过 getSecret() 读取文本文件并转换成二进制字符串 secret
    print(secret)
    s_len = len(secret)
    count = 0
    for i in range(height):
        for j in range(width):
            if count == s_len:
                break
            pix = px[(i, j)]
            r = pix[0]
            g = pix[1]
            b = pix[2]
            r = (r - r % 2) + int(secret[count])
            count += 1
            if count == s_len:
                im.putpixel((j, i), (r, g, b))
                break
            g = (g - g % 2) + int(secret[count])
            count += 1
            if count == s_len:
                im.putpixel((j, i), (r, g, b))
                break
            b = (b - b % 2) + int(secret[count])
            count += 1
            if count == s_len:
                im.putpixel((j, i), (r, g, b))
                break
            if count % 3 == 0:
                im.putpixel((j, i), (r, g, b))
    
    im.save(rpath)


def extrat(mpath, rpath):
    result = ''
    im = Image.open(mpath)
    size = im.size
    px = im.load()
    w = size[0]
    h = size[1]
    length = 80
    count = 0
    flag = 0
    for i in range(h):
        for j in range(w):
            pix = px[(j, i)]
            r = pix[0]
            g = pix[1]
            b = pix[2]
            r1 = r % 2
            count += 1
            if count == length:
                result += str(r1)
                flag = 1
                break
            g1 = g % 2
            count += 1
            if count == length:
                result += str(r1)
                result += str(g1)
                flag = 1
                break
            b1 = b % 2
            count += 1
            if count == length:
                result += str(r1)
                result += str(g1)
                result += str(b1)
                flag = 1
                break
            result += str(r1)
            result += str(g1)
            result += str(b1)
        
        if flag == 1:
            break
    aa = open(rpath, 'w')
    while result:
        tmp = result[:8]
        result = result[8:]
        tmp = int(tmp, 2)
        re = chr(tmp)
        aa.write(re)

print('wowowo!')
start('1.png', '1.txt', 'tets.png')

这段代码实现了一个基本的隐写术操作,将文本隐藏到图片中,并且可以从图片中提取出隐藏的文本

但最后我们还是没有看出其中有什么,那么根据提示的stegosaurus,我们先得理解这是什么东西

经过搜索我们明白了这是什么

stegosaurus(剑龙)

Stegosaurus 是一种隐写工具,允许在 Python 字节码(pyc 或 pyo)中隐藏文件

Release v1.0 · AngelKitty/stegosaurus (github.com)

也就是说其实题目名称在一开始就提醒我们使用这个工具了

那么我们下载工具后执行命令:

./stegosaurus -x O_O.pyc

image-20240907161430753

得到flag

考点:使用steghide工具、会AES解密、使用stegosaurus工具

大流量分析(二)(新协议)

跟大流量分析(一)一样的题目,这一次问的是黑客使用了哪个邮箱给员工发送了钓鱼邮件

既然是钓鱼邮件的分析,那么我们优先分析的肯定是与邮件相关的协议:SMTP协议、POP3协议、IMAP协议(详情可以查看【笔记】【THM】Phishing(网络钓鱼)(这个模块还没学完) - Super_Snow_Sword - 博客园 (cnblogs.com)),我们过滤查看(发现只有IMAP协议报文存在):

image-20240907173832418

可以看出邮件头MAIL FROM :xsser@live.cn

说明黑客使用的邮箱地址为xsser@live.cn,即为flag

考点:邮箱协议分析

[HDCTF2019]你能发现什么蛛丝马迹吗(较难新工具)

下载文件,是一个img文件

IMG文件

IMG 文件是一种磁盘映像文件格式,用于保存整个磁盘(如硬盘、CD/DVD、软盘、U盘等)的完整副本。磁盘映像文件可以包含磁盘的所有数据,包括文件、文件夹、引导扇区、分区表等。

至今我们已经遇到了三种磁盘映像文件格式,在此我做一个总结

文件格式 用途 内容 应用场景
IMG 磁盘映像 逐字节复制的磁盘内容,包括文件系统等 磁盘克隆、备份、嵌入式设备烧写
ISO 光盘映像 逐字节复制的光盘内容,包括引导信息等 操作系统分发、软件安装、光盘备份
VMDK 虚拟机磁盘 虚拟机硬盘的完整内容 虚拟化平台存储虚拟机数据
DMP 内存转储文件 系统崩溃或调试时的内存内容 系统故障分析、调试、取证分析

我们尝试使用7z打开img文件,但是失败了,并且也无法挂载,说明该IMG文件可能是内存转储。

在某些情况下,IMG 文件不是硬盘的镜像,而是计算机的物理内存(RAM)的转储。内存转储包含系统在运行时的实时数据,包括运行的进程、打开的网络连接、加密密钥、密码、以及可能的恶意软件等。

我们要进行内存取证,那么我们需要使用Volatility工具

Volatility

Volatility 是一款强大的内存取证分析工具,专门用于从内存转储中提取重要信息。使用 Volatility 可以分析内存中的活跃进程、注册表、内核模块、网络连接等信息,并帮助识别系统是否被入侵、恶意软件的活动轨迹等。

安装过程略(参考内存取证 - Hello CTF (hello-ctf.com),这里安装的是volatility2),我们使用以下命令:

python2 vol.py -f memory.img imageinfo

-f 用于指定你想要分析的内存转储文件

imageinfo 是 Volatility 的一个插件,它可以用于确定内存镜像的操作系统类型、版本、架构等信息,以及确定应该使用哪个插件进行内存分析

image-20240907190556569

在此我们逐行分析:

          Suggested Profile(s) : Win2003SP0x86, Win2003SP1x86, Win2003SP2x86
这是 Volatility根据内存映像中找到的特征推荐的操作系统Profile,用于后续分析。此处建议的Profile是Windows2003x86的不同版本包括SP0(Service Pack 0)、SP1(Service Pack 1) 和 SP2(Service Pack 2)
                     AS Layer1 : IA32PagedMemoryPae (Kernel AS)
表示这是一个IA32PAE(Physical Address Extension)内存布局,说明系统使用了32位的分页机制,并且支持PAE扩展,可以处理超过4GB的内存
                     AS Layer2 : FileAddressSpace (/home/zxj/Desktop/volatility/memory.img)
表示该内存映像文件位于本地文件系统中的路径
                      PAE type : PAE
确认了内存映像使用 PAE(Physical Address Extension),这是一个允许 32 位操作系统访问超过 4GB 内存的扩展技术
                           DTB : 0xe02000L
DTB 是 页目录表基地址(Directory Table Base),它指向操作系统分页机制中的页目录表,这个值是关键的内存管理数据结构之一。值为 0xe02000L
                          KDBG : 0x8088e3e0L
KDBG 是 Kernel Debugger Block,它是用于调试 Windows 内核的重要结构。它提供了很多关键的内核信息,并帮助 Volatility 获取内存中的结构。其地址为 0x8088e3e0L。
          Number of Processors : 1
表示这是一个单处理器(CPU)系统
     Image Type (Service Pack) : 1
表示内存映像属于 Windows 2003 Service Pack 1,这是更具体的操作系统版本信息
                KPCR for CPU 0 : 0xffdff000L
KPCR(Kernel Processor Control Region) 是 Windows 系统中与每个处理器相关的结构。这里显示 CPU 0 的 KPCR 地址为 0xffdff000L
             KUSER_SHARED_DATA : 0xffdf0000L
KUSER_SHARED_DATA 是 Windows 内存中的一个特殊区域,存储了一些用户模式和内核模式下共享的重要数据。地址为 0xffdf0000L
           Image date and time : 2019-04-25 08:43:06 UTC+0000
这是内存映像捕获时系统的时间,格式为 UTC 时间
     Image local date and time : 2019-04-25 16:43:06 +0800
映像的本地时间(可能是你的时区设置)

以上很多内容过于繁杂,在此我们只需在意第一行的”Suggested Profile(s)“数据

操作系统的profile

不同的操作系统版本和构建在内存中使用不同的内核数据结构和布局。这些差异使得解析内存映像的过程变得复杂。为了正确地解码内存映像中的信息,Volatility 使用 Profile 来匹配内存映像的具体结构。

根据上述内容我们可以猜测操作系统为Win2003SP0x86

接下来我们将探索img文件中的物理内存(RAM)转储中的内容,也就是我们可以查看到在映像捕获时操作系统中运行的进程

我们使用以下命令:

python2 vol.py -f memory.img --profile=Win2003SP0x86 pslist

--profile 参数用于指定内存映像所属的操作系统版本

pslist 是 Volatility 的一个插件,通过遍历 Windows 操作系统的内核数据结构(如 EPROCESS 结构)来提取内存中的进程列表

我们发现操作失败,可能是profile设定出错,那么我们猜测操作系统为Win2003SP1x86:

python2 vol.py -f memory.img --profile=Win2003SP1x86 pslist

image-20240908203409556

在此给出输出字段的详细说明:

Offset(V): 进程的虚拟地址偏移量。
Name: 进程的名称(如 smss.exe)。
PID: 进程的唯一标识符。
PPID: 进程的父进程 ID。
Thds: 进程包含的线程数。
Hnds: 进程打开的句柄数。
Sess: 会话 ID,用于区分用户登录会话(特别是在多用户系统中)。
Wow64: 如果进程运行在 64 位系统的 32 位兼容模式下,则显示为 True,否则为空。
Start: 进程的启动时间。
Exit: 进程的退出时间。如果为空,表示进程当前正在运行。

我们再逐步分析这些进程:

System	这是 Windows 系统的核心进程,负责管理硬件和系统资源。没有父进程,属于系统自启动的进程。
	└─smss.exe	Session Manager 子系统,负责启动会话并管理用户登录。这是操作系统启动时最早的用户模式进程之一。
		└─csrss.exe	客户端/服务器运行时子系统,处理图形用户界面 (GUI) 和控制台窗口等任务。
		└─winlogon.exe	负责处理用户登录和注销的进程,确保系统会话的安全。
			└─services.exe	Windows 服务控制管理器,负责启动和管理系统服务。
				└─vmacthlp.exe	VMware Tools 的一部分,通常用于虚拟机环境。帮助处理与虚拟机之间的同步操作。
				└─svchost.exe	这些是系统托管服务,作用是运行动态链接库 (DLL) 格式的系统服务。Windows 通过 svchost.exe 运行共享的服务进程。每个 svchost.exe 实例可能会托管多个服务。
					└─wmiprvse.exe	WMI 提供程序宿主,负责处理 Windows 管理规范 (WMI) 的相关任务。
					└─wuauclt.exe	Windows 更新自动更新客户端,负责从 Windows 更新服务器获取更新。
				└─spoolsv.exe	打印后台处理程序,负责管理打印作业。
				└─msdtc.exe	分布式事务协调器,处理分布式应用程序的事务管理。
				└─VGAuthService.exe	VMware 认证服务,进一步证明该系统在虚拟化环境中运行。
				└─vmtoolsd.exe	VMware Tools 的守护进程,负责与虚拟机主机的集成。
				└─dllhost.exe	COM+ 服务器应用程序,负责加载和管理 DLL 文件。
				└─vssvc.exe	负责管理卷影复制服务 (Volume Shadow Copy Service),用于备份和还原系统快照。
			└─lsass.exe	本地安全授权子系统,负责安全策略执行和登录验证。
explorer.exe	Windows 资源管理器,负责桌面和文件系统的图形用户界面。
	└─ctfmon.exe	控制输入语言和其他辅助功能的进程。
	└─DumpIt.exe	内存转储工具,通常用于创建内存转储文件的程序。
conime.exe	控制台输入法编辑器,主要用于处理输入法和字符转换。

对于这种题目,我们应该优先查找可疑进程,但我们没看出有什么可疑的进程,都是系统服务

那么我们就优先查看在终端里执行过的命令,输入以下命令:

python2 vol.py -f memory.img --profile=Win2003SP1x86 cmdscan

cmdscan Volatility 提供的插件,用于从内存转储中扫描并提取命令行历史记录。它会查找与命令行界面 (CMD) 相关的活动或历史记录,并列出它们。

image-20240908210047562

我们对输出内容进行逐行分析:

CommandProcess: csrss.exe Pid: 516
表示当前的命令行历史与 Windows 系统的 csrss.exe 进程相关。
CommandHistory: 0x398fba8 
这是一个内存地址,表示这个进程的命令历史记录的存储位置。
Application: DumpIt.exe
这表示在 csrss.exe 进程的命令行历史中,提到了 DumpIt.exe 这个应用程序。
通常,这意味着这个系统内存镜像可能是通过 DumpIt.exe 工具创建的。
Flags: Allocated
Allocated表示该命令历史记录已经分配并且可以使用,表明这段内存被用于存储命令历史。
CommandCount: 0 
是命令历史中的命令数量。这里显示为 0,表示没有实际的命令被记录下来,可能是因为 csrss.exe 本身不执行终端命令,或者这些历史记录已被清空。
LastAdded: -1 LastDisplayed: -1
通常情况下,LastAdded 会显示最后一个命令的编号,LastDisplayed 则会显示最后一个显示的命令编号。-1 表示没有命令可供显示或记录。
FirstCommand: 0
这表示历史中没有第一个命令(因为 CommandCount 为 0)
CommandCountMax: 50
这是历史记录可以保存的最大命令数。它表示 csrss.exe 进程的命令历史最多可以保存 50 条命令。
ProcessHandle: 0x6e4
这是进程的句柄,用于操作系统管理该进程的句柄 ID。

我们可以发现cmd命令使用记录中包含了DumpIt.exe,那就说明我们应该重点分析这个进程。对此,我们可以提取DumpIt.exe进程的内存数据。

为了能够更全面地了解进程之间的关系或行为,我们提取DumpIt.exe的父进程的内存数据:

python2 vol.py -f memory.img --profile=Win2003SP1x86 memdump -p 1992 --dump-dir=./

memdump Volatility 的一个插件,用于从内存镜像中提取某个特定进程的内存数据。该插件会将整个进程空间的内存转储下来,并将其保存为文件。

-p 指定要提取的进程的进程 ID (PID)

--dump 指定保存转储文件的目录

我们发现memdump插件将进程的内存数据以.dmp的格式导出,那么我们就可以继续对.dmp文件进行分析

我们可以使用mimikatz分析.dmp文件:

privilege::debug
//提升 Mimikatz 的权限,使其能够访问某些受保护的进程和内存区域。
sekurlsa::minidump 1992.dmp
//告诉 Mimikatz 加载一个特定的内存转储文件
sekurlsa::logonpasswords full
//用于提取当前系统中所有用户的登录凭证信息,包括明文密码、密码哈希、Kerberos 票据等。

但我们发现mimikatz并没有发现什么,这是因为Mimikatz 主要用于从内存转储(如 .dmp 文件)中提取凭据、密码哈希、Kerberos 票据等安全相关信息,而我们提取出的.dmp文件中没有包含相关的凭据

那么我们想要对其进行分析,实现从内存转储中提取文件(如图片)的功能可以使用文件分离的工具:binwalk和foremost

binwalk和foremost的区别

**Binwalk** 主要用于分析和提取嵌入在固件镜像或二进制数据中的文件和数据,特别适用于固件分析和嵌入式系统。

**Foremost** 主要用于从磁盘镜像、内存转储等数据源中恢复丢失的文件,适用于数字取证和文件恢复。

选择工具时,应该根据具体的任务和数据类型来决定使用哪种工具。如果需要分析固件或嵌入式数据,使用 Binwalk。如果需要从存储设备或内存转储中恢复文件,使用 Foremost。

我们首先使用binwalk发现提取出了一大堆7z和zip压缩文件,但都打不开,那么我们再使用foremost看看:

image-20240909002900041

提取出了许多内容,我们查看发现png文件夹中含有线索:

image-20240909003110631

image-20240909003142882

通过扫码我们发现了一串密文,再通过图片中给出的key(密钥)和iv(向量)来看,这应该是对称密码加密,密钥长度为16,符合AES加密的密钥特征

我们尝试解密,得到flag(这里使用了工具CaptfEncoder,由于密钥长度符合16字节所以AES加密解密的填充模式为No Padding):

image-20240909004547299

未解之谜:cyberchef的AES加解密是乱码

image-20240909004745733

考点:使用Volatility进行内存取证、使用foremost从内存转储中恢复文件、理解AES加密方式

[INSHack2019]INSAnity(简单)

下载文件,是一个md文件,直接给出了flag,推测是一个签到题

[INSHack2019]Sanity(简单)

下载文件,又一个md文件,还是直接给出了flag

很好的色彩呃?(新)

下载文件,是一个gif图片文件

按照图片隐写思路,第一步、第二步无果,我们优先使用stegsolve进行逐帧分析,但还是没看出什么:

image-20240909110244790

此时再次看看题目,已经提示了我们注意“色彩”,那么这其中肯定存在一种隐写术

颜色隐写术

图片的内容仅仅由不同颜色的黄条组成,黄条颜色的RGB值可能暗藏玄机

image-20240909110632560

image-20240909110652932

image-20240909110704582

image-20240909110725156

image-20240909110744143

image-20240909110757832

我们可以注意到不同黄条的HTML标记仅最后两位发生了变化,这可能是一种16进制的信息:

image-20240909110920681

提交发现即为flag

考点:理解颜色隐写术

[ACTF新生赛2020]frequency(新)

下载文件,是一个doc文件,我们打开查看内容:

image-20240909111043533

这一次没有跟背景颜色一样的白色字体的隐藏,我们打开doc的显示隐藏文字选项:

文件->选项->显示->打开显示隐藏文字的功能

image-20240909111220092

image-20240909111431003

为了能够复制隐藏的文字内容,我们再将全文的字体设置中的隐藏选项关闭:

image-20240909112009574

按照题目描述,flag有两截,我们继续寻找,在文件的属性那一栏看到了隐藏的第二段flag内容:

image-20240909111624768

我们分析两段flag,cyberchef解出一大堆字母,字母看上去杂乱无章,我们尝试字频统计:

image-20240909112228727

image-20240909112347701

虽然括号的位置貌似出错了,但我们看到了关键词“actf”,我们推测flag提交:

flag{actfplokmijnuhbygvrdxeszwq}{}	错误
flag{actfplokmijnuhbygvrdxeszwq}	错误
flag{plokmijnuhbygvrdxeszwq}{}	错误
flag{plokmijnuhbygvrdxeszwq}	正确

考点:会打开doc显示隐藏内容功能、检查doc属性、字频统计

[INSHack2018]Self Congratulation(新)

下载文件,是一张png格式的图片:

image-20240909112932377

按照图片隐写思路,第一步、第二步、第三步无果,我们注意观察图片可以发现最值得注意的地方就是图片左上方不自然的黑白方块

二进制隐写术

我们仔细分析这些黑白方块,像LSB隐写一样可能存在二进制隐写的信息

image-20240909113452871

00110001001
10010001100
11001101000
01101010011
01100011011
10011100000

尝试解码上交,还真是flag:

image-20240909113633141

考点:理解二进制隐写术

[INSHack2017]insanity-(简单)

下载文件,又一个md文件,还是直接给出了flag

[2022红包题]虎年大吉(知识巩固题)

下载文件,是一个png格式的图片

按照图片隐写思路,第一步无果,我们优先使用010 editor进行分析,发现文件结尾插入隐藏了信息:

image-20240909113948506

我们喂给cyberchef得到了flag:

image-20240909114021680

考点:使用十六进制编辑器找到插入隐藏的信息

[BSidesSF2019]table-tennis(知识巩固题)

下载文件,发现里面是一个pcapng格式的文件,我们使用wireshark打开查看

按照数据包分析思路,我们先进行协议分级:

image-20240909114313845

我们发现TCP协议占比最高,并且使用了TLS协议加密(Transport Layer security)占比的内容最多;但流量包中并没有传输相关的私钥,我们无法解密,我们优先分析所有TCP流看看并没有什么值得注意的信息,我们求次分析所有的UDP流也没有找到值得注意到信息,那么我们开始分析ICMP协议的内容:

image-20240909115241049

ICMP协议中的Data行又藏有信息,我们使用tshark全部提取出来进行分析:

tshark -r attachment.pcapng -Y "icmp" -T fields -e data > data.txt

去重:

^(.*?)$\s+?^(?=.*^\1$)

再进行转码,得到以下内容:

<html>
	<html>
	<html>
	<html>
	<html>
	<head>
	<head>
	<head>
	<head>
	<head>
	<title> <title> <title> <title> <title> I <3 CorI <3 CorI <3 CorI <3 CorI <3 Corgi </titgi </titgi </titgi </titgi </title>
		<sle>
		<sle>
		<sle>
		<sle>
		<script>
dcript>
dcript>
dcript>
dcript>
document.ocument.ocument.ocument.ocument.write(atwrite(atwrite(atwrite(atwrite(atob("Q1RGob("Q1RGob("Q1RGob("Q1RGob("Q1RGe0p1c3RBe0p1c3RBe0p1c3RBe0p1c3RBe0p1c3RBUzBuZ0FiUzBuZ0FiUzBuZ0FiUzBuZ0FiUzBuZ0FiMHV0UDFuMHV0UDFuMHV0UDFuMHV0UDFuMHV0UDFuZ1Awbmd9Z1Awbmd9Z1Awbmd9Z1Awbmd9Z1Awbmd9"));
		<"));
		<"));
		<"));
		<"));
		</script>/script>/script>/script>/script>

	</hea

	</hea

	</hea

	</hea

	</head>

	<bod>

	<bod>

	<bod>

	<bod>

	<body>

		<dy>

		<dy>

		<dy>

		<dy>

		<h1> Woofh1> Woofh1> Woofh1> Woofh1> Woof!! </h1>!! </h1>!! </h1>!! </h1>!! </h1>

	</bod

	</bod

	</bod

	</bod

	</body>

</hty>

</hty>

</hty>

</hty>

</ht

(好像还是有很多冗余数据,但还是看得懂的)

总之重点放在其中的document.write(atob("Q1RGe0p1c3RBUzBuZ0FiMHV0UDFuZ1Awbmd9")),使用了atob()函数来解码base64编码过的数据(我们可以像下图这样处理冗余数据),我们解码得到flag:

image-20240909120733042

image-20240909120809054

考点:流量协议分析、理解ICMP协议、处理冗余数据

[INSHack2019]gflag(新工具)

下载文件,是一个没有后缀的gflag文件,我们使用010editor打开发现里面的内容,一头雾水:

image-20240909121351371

image-20240909121721166

我们明白了这是3D打印机的G代码,我们应该如何让这些代码跑起来呢?

经过一番搜寻,我们可以使用这个在线网址进行预览gcode viewer - online gcode viewer and analyzer in your browser!,我们将gflag加上.gcode的后缀并上传

image-20240909122148164

我们在2D渲染选项中将干扰视图的选项取消,得到了flag:

image-20240909122244794

考点:不会就搜索就问、理解G代码

[*CTF2019]otaku(较难孬知识巩固题)

下载文件,是一个加密的zip文件,发现是伪加密我们进行修改:

image-20240909122747353

解压后,内容是一个doc文件和一个加密的zip文件(不是伪加密)

我们打开doc文件:

image-20240909123000647

有一块很显眼的空白,我们分析发现了隐藏的信息:

image-20240909123029539

“I love you”并不是zip文件的密码

我们观察zip文件中的内容,有一个last word.txt文件,这可能是存在着已知明文攻击:只要我们推测出了last word.txt中的内容,我们就可以创建一个与last word.txt文件CRC值一样的文件进行已知明文攻击

image-20240909123320732

那么按照提示last words.txt,我们尝试新建各种文件,尝试构造出与last word.txt文件CRC值一样的文件

这里失败了,原因是buuctf没有把原题的关键提示给出来:

One day,you and your otaku friend went to the comic expo together and he had a car accident right beside you.Before he died,he gave you a USB hard disk which contained this zip.Please find out his last wish.
提示:The txt is GBK encoding.

提示要我们对txt进行GBK编码。。。

那么我们就使用GBK编码来构造txt文件:

# -*- coding:GBK -*-
f = open('data.txt','w')
s = "Hello everyone, I am Gilbert. Everyone thought that I was killed, but actually I survived. Now that I have no cash with me and I’m trapped in another country. I can't contact Violet now. She must be desperate to see me and I don't want her to cry for me. I need to pay 300 for the train, and 88 for the meal. Cash or battlenet point are both accepted. I don't play the Hearthstone, and I don't even know what is Rastakhan's Rumble."
f.write(s)
f.close()

以上脚本来源于文章 *CTF2019]otaku-CSDN博客

我们可以看出last word.txt中的内容应为原文中维奥莱特回想的吉尔伯特对她说的最后一句话(“i love you是干扰项”)

我们创建一个zip文件,将生成的data.txt导入,发现它的CRC值与last word.txt的一样:

image-20240909124740263

我们就此进行已知明文攻击,等待后得到了解压密码:My_waifu

解压文件,得到了flag.png图片

按照图片隐写思路,第一步、第二步无果,我们优先使用stegsolve进行分析:

image-20240909131646018

图片较大,关闭相关通道仔细观察图片的左上角会有小小的黑白相间的隐写信息,我们进行解密即得到了flag

考点:压缩包伪加密、压缩包已知明文攻击、LSB隐写

[MRCTF2020]小O的考研复试(知识巩固题)

下载文件,pdf中的内容是数学题:

image-20240909125810417

我们可以写一个脚本来解出这道题

a = 0
for i in range(19260816):
	a = 2*pow(10,i)+a
a = a%1000000007
print(a)

跑了非常非常久。。。

我们可以使用以下更加简单的脚本:

a=2
for i in range(19260816):
    a = a * 10 + 2
    a=a%1000000007
print(a)

得到了flag

image-20240909131244418

考点:脚本编写

真的很杂(新工具)

下载文件,是一张jpg格式的图片:

image-20240909191249844

我试了,假的flag

按照图片隐写思路,第一步无果,我们优先使用010editor进行分析,发现了插入隐藏的压缩包:

image-20240909191513475

分离文件并打开查看,我们可以看见压缩包中的内容:

image-20240909192302973

这是一个典型的 APK(Android应用程序包) 文件内容

APK文件格式简介

APK文件是Android应用程序的分发和安装格式,实际上是一个经过压缩的ZIP文件,其中包含了应用程序运行所需的所有资源、代码和元数据。

1. META-INF 文件夹

  • META-INF

    文件夹主要用于存放APK签名信息,确保应用程序在安装时没有被篡改。它通常包含以下内容:

    • CERT.RSA:包含应用程序开发者的公钥,APK的签名证书。
    • CERT.SF:包含签名的散列文件(hash),用于校验APK文件中的内容。
    • MANIFEST.MF:列出APK中所有文件的清单及其散列值,用于完整性验证。

APK文件必须经过签名才能被Android系统安装,因此这些文件对应用程序的验证和安全性至关重要。

2. res 文件夹

  • res

    文件夹包含应用程序的资源文件,比如图像、布局文件、字符串资源等。资源文件根据应用的不同需求,通常分为以下几个子文件夹:

    • drawable:存放各种图像资源(.png、.jpg等)。
    • layout:存放布局文件(.xml格式),定义应用界面设计。
    • values:存放字符串资源(如 strings.xml)、样式文件、颜色定义等。
    • raw:存放未压缩的原始文件资源,如音频、视频等。
    • mipmap:存放应用程序的图标。

3. AndroidManifest.xml

  • AndroidManifest.xml

    是每个Android应用程序的核心配置文件,它定义了应用程序的关键属性。该文件包括:

    • 应用程序的名称、图标、版本信息等。
    • 应用的权限声明,比如访问网络、使用摄像头等。
    • 各个组件(Activity、Service、BroadcastReceiver等)的定义和配置信息。
    • 应用程序的入口点(通常是主Activity)。
    • 应用的最小支持Android版本和兼容性设置。

这个文件对于Android系统来说非常重要,它告诉系统如何加载和执行应用程序。

4. classes.dex

  • classes.dex 文件是Dalvik Executable文件,包含了经过转换的字节码。Android应用程序的Java代码最终会被编译成.dex文件,供Android的Dalvik虚拟机或ART(Android Runtime)运行。
  • 这个文件包含了应用的所有核心逻辑代码和实现。

5. resources.arsc

  • resources.arsc 文件是一个资源索引文件,存放了已编译的资源信息。这个文件将应用程序中的资源(如字符串、颜色、布局等)进行了优化并索引,便于Android系统快速查找和加载资源。
  • 它包含了所有的资源映射,允许应用程序快速访问资源,而不必每次都从 res 文件夹中动态加载。

因此,我们可能需要进行Android逆向。在此参考了文章Android逆向 - 简书 (jianshu.com)

Android逆向思路

1. 先试着在模拟器中运行apk文件,查看是否存在可以直接给出flag的地方并理解软件布局
2. 使用工具AXMLPrinter2.jar对资源文件xml进行破解
3. 使用工具dex2jar将dex文件转换为jar文件
4. 使用jd-gui、GDA等工具分析java源码
5. 使用apktool等工具进行反编译修改

首先我们将.zip压缩文件后缀改为了.apk,并使用安卓模拟器运行,发现直接给出了flag

image-20240909194346866

但提交了发现并不是flag,我们多次点击give you flag按钮发现flag随机生成

GDA

是一款主要用于分析安卓应用(APK 文件),特别是分析和反编译 .dex 文件中的代码的工具(直接导入apk文件即可)。

在此我直接使用GDA进行源码分析(优先分析含有main字样的主函数):

image-20240909195031711

image-20240909195046532

这里不做仔细分析,我们也能看出个大概

MainActivity中有一段:

this.findViewById(2131034174).setOnClickListener(new MainActivity$1(this, this.findViewById(2131034173)));
为 ID 为 2131034174 的视图设置了一个点击事件,点击事件的逻辑被定义在 MainActivity$1(即 MainActivity 的一个内部类)中

MainActivity$1 用于处理点击逻辑,点击后生成flag中含有两个参数a、b随机生成,而我们可以看出MainActivity已经给出了正确的值

String True1 = "flag{25f991b27f";
String True2 = "c";
String True3 = "dc2f7a82a2b34";
String True4 = "3";
String True5 = "86e81c4}";

考点:文件分离、Android逆向

[V&N2020 公开赛]真·签到(简单)

签到题

[GKCTF 2021]FireFox Forensics(新工具)

下载文件,里面是firefox的记录文件和密钥文件

image-20240909200136677

我们可以对其中的json文件使用cyberchef进行美化方便分析:

image-20240909201117048

浏览器取证

在浏览器取证中,Firefox 的 logins.json 文件是非常重要的文件之一,因为它包含了用户的已保存登录凭据。

为什么 logins.json 中会有这些敏感内容?

  • 用户便利性:现代浏览器(包括 Firefox)通常会提供保存登录凭据的功能,目的是让用户在访问常用网站时无需每次都输入用户名和密码。Firefox 将这些凭据保存在本地的 logins.json 文件中,供以后自动填写表单使用。
  • 自动填充功能:浏览器的自动填充功能依赖于这些保存的登录信息,当用户访问登录页面时,浏览器会根据保存的凭据自动填写用户名和密码。
  • 加密保护:虽然这些信息是敏感的,但 Firefox 会使用主密码(如果设置了)或操作系统的存储机制来加密这些数据,以防止未经授权的访问。如果用户没有设置主密码,这些数据可能会依赖操作系统的凭据管理器进行加密和解密。

我们可以使用专门用于火狐浏览器取证的工具脚本:lclevy/firepwd: firepwd.py, an open source tool to decrypt Mozilla protected passwords (github.com)

火狐浏览器取证firepwd工具脚本工作原理:

1.读取 logins.json 文件 → 提取加密的登录信息。

2.读取 key4.db 文件 → 获取加密密钥(若需要)。

3.使用 NSS 库进行解密 → 使用解密密钥解密 Base64 编码的用户名和密码。

4.显示解密结果 → 显示明文的用户名和密码。

将logins.json和key4.db放入同路径文件夹中,使用以下命令:

python firepwd.py

即得出了登录凭据解密后的内容:

image-20240909201721395

(注:这题不知道为什么不使用flag{}了,使用GKCTF{})

考点:理解浏览器取证原理

[RCTF2019]disk(较难新工具)

下载文件,是一个vmdk文件

我们尝试使用7z提取其中的内容,打开报错了:

image-20240909202134335

但我们还是可以提取其中的0.fat文件,我们可以将其当做一个虚拟硬盘文件进行挂载

FAT文件系统简介

FATFile Allocation Table,文件分配表)是一种早期广泛使用的文件系统,最初由微软开发,用于管理存储设备上的文件和目录结构。FAT 文件系统有多个版本,包括 FAT12、FAT16 和 FAT32,其中 FAT32 是最常见的一种,尤其用于较大容量的存储设备,如 USB 闪存盘、SD 卡和外部硬盘等。

特性 FAT32 exFAT NTFS
最大单个文件大小 4GB 128PB 16TB
最大分区大小 2TB 128PB 256TB
兼容性 极高(所有设备和系统) 较高(多数设备和系统) 较低(主要是 Windows)
文件权限支持 支持
文件压缩 支持
文件加密 支持(EFS)
适用场景 小型存储设备、便携使用 大文件传输、跨平台兼容 大容量存储、复杂环境

我们可以使用VeraCrypt,对fat文件进行挂载

VeraCrypt

VeraCrypt 是一个流行的开源磁盘加密工具,它可以加密整个磁盘分区或创建虚拟加密盘。结合 FAT 文件系统,VeraCrypt 可以用于创建加密的 FAT 文件系统卷,从而为用户提供存储数据的隐私和安全保障。

image-20240909204759554

我们尝试挂载,发现需要密码,一般这种密码猜测与比赛名有关,rctf猜测正确!

image-20240909205001215

挂载成功,出现了一个本地磁盘A,其中有一个图片文件说是useless_file,我们先不要管它,看看password.txt的内容:

image-20240909205101015

隐藏卷

VeraCrypt 中,同一个加密卷(如 FAT 文件系统)能够通过输入不同的密码进入不同的文件系统,这种特性被称为 “隐藏卷”功能。这是 VeraCrypt 的一个高级功能,旨在提高用户数据的安全性和隐私保护。

隐藏卷 是 VeraCrypt 中的一项技术,它允许用户在同一个加密卷中创建两个文件系统:一个是外部卷,另一个是隐藏卷。这两个文件系统共享同一个物理磁盘空间,但只有在输入正确的密码时,才能访问各自的卷内容。具体来说:

1.外部卷

  • 外部卷是一个普通的加密卷,用户可以通过 VeraCrypt 创建并访问它。
  • 它像是一个正常的加密容器,存储了用户的文件和数据。任何人知道这个卷的密码,输入后都可以访问该卷中的内容。

2.隐藏卷

  • 隐藏卷存在于外部卷的空闲空间中,是一个完全独立的文件系统。隐藏卷通过不同的密码访问,只有知道隐藏卷密码的人才能进入。
  • 这个隐藏卷不可见,也不会显示为外部卷中的文件或数据,除非输入了正确的隐藏卷密码。

VeraCrypt 使用密码不仅仅是为了解密文件,它还用于确定加载哪个卷。外部卷和隐藏卷有各自的密码,输入正确的密码时,VeraCrypt会根据密码解密相应的数据区域并挂载相应的卷。

因此我们卸载加密卷后再次尝试挂载[0].fat文件,这次使用密码:RCTF2019

但隐藏卷一打开就提示我们要进行格式化:

image-20240909205503494

这里我们使用十六进制编辑器对磁盘进行分析,但不是010editor,而是winhex

010editor和winhex的区别

特性 010 Editor WinHex
界面 现代、用户友好、支持可视化模板解析 传统、简洁,但功能丰富
文件格式解析 强大的模板系统,自动解析二进制文件格式 无模板系统,手动解析数据
数据恢复与取证 基本支持 强大支持,特别是取证功能和数据恢复
脚本与自动化 强大的脚本功能,C 风格脚本 基本脚本功能,主要用于自动化恢复和分析
硬盘与内存编辑 支持,但主要面向文件级别 强大支持,适合物理磁盘和内存编辑
适用领域 文件格式分析、逆向工程、自动化处理 数据恢复、数字取证、磁盘与内存分析

image-20240909210000809

打开后开头都是乱码,但往下看发现了flag后半段:

image-20240909210508735

flag前半段呢?经过这个启发我对vmdk文件进行了16进制编辑分析找到了flag前半段:

image-20240909210821951

考点:理解FAT文件系统、使用VeraCrypt工具挂载加密卷、理解隐藏卷、使用winhex对磁盘进行分析

MRCTF2020]摇滚DJ(建议大声播放(知识巩固题)

下载文件,是一个wav格式的音频格式

我们听一下,一听就是SSTV音频,我们使用MMSSTV进行分析得到flag(图片由于环境有些吵出现了坏点):

image-20240909211322126

考点:理解SSTV

[INSHack2018]INSanity(简单)

直接给出了flag,应该是签到题

[GUET-CTF2019]520的暗示(新工具孬题)

下载文件,里面是一个.dat格式的文件

DAT格式文件

DAT格式的文件 是一种通用的数据文件格式,通常被用来存储各种应用程序所生成的原始数据。DAT 文件的具体内容和结构取决于创建它的应用程序,因此 DAT 文件本身没有严格定义的格式。

DAT 文件的常见用途

  • 应用程序数据:许多应用程序使用 DAT 文件来存储数据,例如游戏中的关卡数据、配置文件、日志、缓存等。
  • 多媒体数据:某些视频、音频和图像应用程序也可能使用 DAT 文件来存储多媒体信息,如视频流、音频轨道等。
  • 数据库文件:一些数据库软件可能使用 DAT 文件来存储结构化数据。
  • 邮件客户端:例如,早期的微软 Outlook Express 会使用 DAT 文件来存储电子邮件附件的临时数据。

DAT 文件的特点

  • 没有特定的格式:DAT 文件没有标准化的文件格式,它可以包含任何类型的数据。这些数据可能是文本、二进制数据或应用程序的专有格式,因此在某些情况下,直接查看或编辑 DAT 文件可能无法理解其内容。
  • 与应用程序相关:如何解释或处理 DAT 文件,通常由生成它的应用程序决定。不同的应用程序可以以完全不同的方式使用和解释 DAT 文件。

如何打开和查看 DAT 文件?

打开 DAT 文件的方式取决于文件的具体内容以及生成它的应用程序。以下是一些常见的方法来查看或编辑 DAT 文件:

  • 文本编辑器:如果 DAT 文件是以文本格式存储的数据(例如日志或配置文件),您可以使用任何文本编辑器(如 Notepad++、Sublime Text、VS Code 等)来打开和查看它的内容。
  • 十六进制编辑器:如果 DAT 文件包含二进制数据,可以使用 十六进制编辑器(如 010 Editor、WinHex)查看文件的二进制结构。这样可以让您看到文件中的原始数据。
  • 专用应用程序:有些 DAT 文件只能通过生成它的应用程序来读取或解释。例如,如果 DAT 文件是游戏生成的关卡数据,只有该游戏或它的编辑工具才能正确读取它。
  • 文件格式推断工具:如果不确定 DAT 文件的来源,可以尝试使用一些文件格式推断工具(如 TrID),它可以帮助分析 DAT 文件的类型并建议合适的程序来打开它。

总之,DAT 文件 本质上是通用的数据文件,没有统一的格式标准。打开和查看 DAT 文件的方式通常取决于生成它的应用程序。

我们根据文件名“photo.dat”分析这是一个图片文件,但图片软件打不开,推测.dat 文件在存储聊天记录、图片、音频和视频等数据时,可能进行了加密和压缩处理,采取了数据加密策略,使得存储的 .dat 文件无法直接查看或使用常规工具打开。

在这里使用了大佬写的工具:[更新]微信PC版DAT文件解密工具V0.5 - 琳迪软件(LINDI.CC)

我们可以直接使用它对.dat文件进行自动解密,输出了一张图片:

image-20240909214027937

我们也可以拿输出的图片与源文件.dat进行比较,发现加密的方式仅仅是对文件进行了与0x33进行异或:

image-20240909214331810

那么我们继续分析这个图片的内容(这里可能是没有给出足够的提示,以后要记住这种信息的考点了)

这张图片是一个移动网络信号强度的检测界面,提供了多个关于当前 LTE 网络的信息:

网络运营商

运营商名称:CHN-UNICOM(中国联通)
MCC(移动国家代码):460(中国)
MNC(移动网络代码):01(中国联通)
服务小区信息

数据网络类型:LTE	(LTE 是 4G 网络的一种实现技术)
小区类型:LTE
TAC(跟踪区码):30542
PCI(物理小区标识):150
ECI(演进小区标识):180375296(ECI 是由 eNodeB 和 CellID 组成的唯一标识)
EARFCN(下行和上行频率的频点编号):下行1650 / 上行1965
频率:1850 MHz(下行频率)/ 1755 MHz(上行频率)
BAND(频段):3(FDD-LTE)
信号强度

RSSI(接收信号强度指示):-57 dBm(通常代表信号强度的总体电平)
RSRP(参考信号接收功率):-89 dBm(专门针对 LTE 网络的信号质量指标)
RSRQ(参考信号接收质量):-9 dB(反映信号的质量,一般取值越大越好)
SINR(信号与干扰加噪声比):11.6 dB(越高越好,表示信号与噪声的比值)
邻小区

当前没有显示邻小区的信息,显示为 “NO VALUE”。
图表

信号强度随时间的变化图表,显示了过去 1 分钟内 RSRP 信号的波动。

我们能够根据以上信息进行基站地址定位移动联通电信基站位置查询 (juhe.cn)

image-20240909214937406

最终的flag也是没有给出足够的提示,为基站的地址

flag{桂林电子科技大学花江校区}

考点:理解并分析.dat文件、根据LTE定位基站地址

[GWCTF2019]huyao(新工具)

下载文件,是两张一模一样的图片

按照图片隐写思路,第一步、第二步、第三步无果,使用了zsteg、cloacked-pixel无果后,我们优先查看其中是否存在盲水印(在此我们先使用github开源的BlindWaterMark-master):

python2 bwm.py decode huyao.png stillhuyao.png out.png

image-20240909215912626

看来是不存在普通的盲水印,这里我们再尝试基于频域的盲水印脚本解密

基于频域的盲水印

普通盲水印通常指时域的盲水印,这种方式直接在图像、音频或视频的原始数据(如像素值或音频采样点)中嵌入水印信息。

基于频域的盲水印则将水印嵌入到图像或音频的频率域中,而不是直接嵌入到时域中的像素或采样点。

频率域

图像的频率域是指将图像从空间域转换到频率域后的表现方式,用于描述图像中像素值的变化频率。不同于空间域中通过像素的空间位置和灰度值来表示图像,频率域则描述图像中不同位置的像素强度如何变化。

这里给出脚本kindred-adds/BlindWaterMarkplus: 频域盲水印隐写脚本 (github.com)

我们进行提取:

python2 BlindWaterMarkplus.py --original huyao.png --image stillhuyao.png --result out.png

从盲水印中提取出了flag:

image-20240909220959863

考点:理解基于频域的盲水印

大流量分析(三)(知识巩固题)

跟大流量分析(一)、大流量分析(二)一样的题目,这一次问的是黑客预留的后门的文件名是什么

根据这一点,我们应该优先分析http协议:

image-20240910101502653

还是没有明显的交互php文件,但我们进行逆向思维,假如我们是黑客,在上传了后门文件后肯定会对其使用命令进行测试查看能否回显,常用的测试指令便是phpinfo()

我们进行搜索:

image-20240910102354740

没有给出后门文件的地址,我们再分析下一个流量包,再没有就继续找:

image-20240910103357613

最终我们可以得出,黑客预留的后门的文件名为“admin.bak.php”,即为flag

考点:流量分析、后门文件分析

[XMAN2018排位赛]file(较难新工具)

下载文件,是一个img文件

我们使用7z打开解压查看,可以看见其中内容:

image-20240910103831025

仅仅有一堆奇怪的猫猫图片和两个文件夹组成,其中一个还是空文件夹

[SYS]文件夹

在操作系统(OS)中,[SYS] 文件夹(或系统文件夹)通常用于存储与系统相关的重要文件和配置。我们打开发现里面有一个名为“journal”的文件,在系统文件夹中,Journal 文件通常与文件系统日志有关。文件系统日志(Journal)用于记录文件系统的变化,帮助在系统崩溃或意外断电后恢复数据。(有Journal文件可以推测这里使用了ext4文件系统)

那么我们要做的可能是将lost+found文件夹中被删除的目录或文件进行恢复

我们首先查看img文件使用的文件系统:

file attachment.img

image-20240910104958882

可以发现img文件使用的是ext4文件系统

(以下内容皆为需要学习和理解的内容与题目可能无关)

ext4文件系统简介

ext4 是第四代扩展文件系统,设计用于提高性能、可扩展性和数据安全性。它最初作为 ext3 文件系统的改进版本推出,具有许多新的特性。

支持最大 1 EB(exabyte,1024 PB)的大分区,并且支持最大 16 TB 的单个文件。

使用延迟分配策略来提高性能。它不会立即为写入的数据分配磁盘块,而是等待到有足够的信息可用,从而更好地组织磁盘布局,提高写入效率并减少磁盘碎片。

进一步优化了日志的效率,并提供了三种日志模式:writebackorderedjournal,以便用户根据需求选择不同的平衡点。

能够一次为文件分配多个块,从而提高大文件的写入性能。

通过元数据校验和机制,增加了系统崩溃后文件系统自我修复的能力。

常见的linux文件系统

文件系统 日志功能 最大文件大小 最大分区大小 快照支持 性能特点 应用场景
ext2 16 TB 32 TB 写入性能好,无日志开销 只读或数据修改不频繁的场合
ext3 16 TB 32 TB 较好的数据恢复能力 普通服务器和工作站
ext4 16 TB 1 EB 更好的性能和日志优化 大多数 Linux 系统和应用场景
XFS 8 EB 8 EB 并发性能极佳,适合大文件 高并发、海量数据处理,数据中心
Btrfs 16 EB 16 EB 快照、压缩、RAID 支持 容器、虚拟化、需要快照的场景
ZFS 16 EB 256 ZB 数据完整性保障强,功能丰富 高可靠性存储系统、备份服务器
F2FS 16 TB 16 TB 针对闪存优化 嵌入式系统、闪存存储设备

我们要知道之前讲过的FAT32、exFAT 和 NTFS 是 Microsoft 开发的文件系统,广泛用于 Windows 操作系统和跨平台存储设备。而 ext4 是 Linux 中常用的文件系统。

返回题目,我们使用mount命令对img文件进行挂载:

sudo mount attachment.img 1	#将img文件中的内容挂载到文件夹1中

我们很有可能遇到以下情况:

image-20240910110337210

这个错误提示我们设置挂载环回设备(loop device)失败,在此有必要介绍一下linux挂载img文件原理

linux挂载img文件原理

在 Linux 系统中,“挂载”是指将一个文件系统(如磁盘分区、外部设备或文件)接入到系统的目录树中,使得用户和程序能够通过路径访问它。Linux 是一个基于文件的系统,所有资源(文件、设备等)都可以通过目录路径来访问。

通常,挂载的对象是硬盘分区、光盘等实际的物理设备,但 Linux 也允许挂载其他类型的对象,比如磁盘映像文件。这就是环回设备的作用所在。

环回设备(loop device)是一种虚拟的块设备,它允许你将一个文件当作一个块设备来对待。换句话说,环回设备把一个普通的文件变成可以被 Linux 当作磁盘来使用的虚拟设备。

环回设备的核心思想是将文件系统中的普通文件(如 .img 文件)视为一个虚拟的块设备。

通过 loop 设备,Linux 能够把一个文件(例如一个磁盘镜像)作为一个块设备处理,就像处理硬盘或 USB 一样。

这使得你能够直接挂载磁盘映像文件,将其内容映射到一个目录中,而无需物理设备。

当你挂载一个 .img 文件时,Linux 实际上通过以下步骤操作:

环回设备映射:首先,Linux 将 .img 文件映射到一个环回设备上,类似于将该文件“伪装”成一个虚拟磁盘。例如,你可以使用 losetup 命令将 .img 文件绑定到环回设备 /dev/loop0:

sudo losetup /dev/loop0 image.img
现在,Linux 将 /dev/loop0 视为一个块设备,尽管它实际上只是磁盘镜像文件的一种映射。

识别文件系统:接下来,Linux 会像处理物理磁盘一样,试图识别这个环回设备上的文件系统。如果 .img 文件包含有效的文件系统(例如 ext4、FAT32),Linux 将识别它并准备挂载。

挂载到目录:最后,使用 mount 命令将这个虚拟设备挂载到某个目录。例如:

sudo mount /dev/loop0 /mnt/img_mount
这时,.img 文件的内容就可以通过 /mnt/img_mount 目录访问了。

回归题目,我们遇到了设置挂载环回设备失败的问题,在此我们首先查看以下我们空闲的设备:

sudo losetup -f

losetup 是 Linux 中用于管理和配置环回设备的命令

-f 查找并返回下一个可用的环回设备

image-20240910111301052

说明loop0这个设备空闲,可以使用,我们进行挂载:

sudo losetup /dev/loop0 attachment.img
sudo mount /dev/loop0 /mnt/	#将/dev/loop0设备中的内容挂载到文件夹/mnt/中

挂载成功,我们可以在linux系统中看到我们挂载的内容了:

image-20240910112031503

文件恢复的原理

在 ext3/ext4 文件系统中,删除文件并不意味着文件数据立即从磁盘上清除。

删除操作通常只会将文件的 元数据(如 inode 表中的指针)标记为“已删除”,即将文件从目录结构中移除,释放对应的 inode 和数据块,但实际存储的数据仍然存在,直到被新的数据覆盖。

简单来说,文件删除只是更新了文件系统的结构(元数据),并未立刻抹去磁盘上存储的文件内容。

(以上内容皆为需要学习和理解的内容与题目可能无关)

现在我们可以尝试恢复文件了,在此我们需要工具extundelete

extundelete

extundelete 通过读取文件系统的 inode 表日志文件(Journal),找到已删除文件的相关信息。

ext 文件系统会为每个文件分配一个 inode 结构,inode 中记录了文件所在的数据块、权限、大小等信息。当文件被删除时,inode 表中的指针被清除或标记为可用,但如果数据块未被覆盖,extundelete 可以从剩余的 inode 信息中找到数据块的位置,并尝试恢复。

在 ext3/ext4 文件系统中,文件系统的日志(Journal)还会记录文件的某些元数据。extundelete 可以利用这些日志来恢复最近删除的文件或目录。

回到题目,我们使用以下命令:

extundelete attachment.img --restore-all

--restore-all 一个选项,意思是恢复.img文件中的所有已删除文件

image-20240910115439235

此时目录下出现了一个“RECOVERED_FILES”文件夹,里面就是我们恢复出来的文件,我们导出查看:

image-20240910115623122

在该文件的末尾找到了flag

考点:理解ext4文件系统、理解文件恢复原理、会使用extundelete进行文件恢复

寂静之城(孬题)

题目的网址已经失效,在此给出其他文章的WP(原文地址:BUUCTF-Misc-No.4_ctf 寂静之城-CSDN博客

打开网址,能看到一篇书评:

image-20240910120047179

我们能从点赞记录中找到出题人的账号:

image-20240910120113832

应该是可以通过出题人豆瓣的主页找到一篇微博找到flag:

image-20240910120618472

考点:社会工程学

[SCTF2019]Ready_Player_One(较难新工具)

下载文件,是一个unity编写的游戏文件:

image-20240910131855988

打开游戏,是一个打飞机的游戏,可能我们达到高分即可得到flag

貌似是逆向大佬玩的题目,尝试使用Cheat Engine对游戏数据进行修改

Cheat Engine

Cheat Engine 是一个强大的开源工具,主要用于修改和调试计算机游戏的内存和数据。它可以用来改变游戏的变量、解锁游戏功能,或者修复游戏中的问题。除了游戏修改,Cheat Engine 也可以用于其他需要内存修改的应用场景,比如测试和调试软件。

(使用教程和案例可以参考文章,有兴趣的可以试试这题反正我过关了(^-^)V,要注意的是前进的方向与坐标的关系,游戏中角色向初始面对方向前进即增大坐标利用Cheat Engine与DnSpy破解Unity游戏的技术与实践 - 先知社区 (aliyun.com)

但在这题中最终我们找不到分数变量而修改失败:

image-20240910133741473

这里可能是使用了Anti-Cheat Toolkit插件防止我们作弊

(参考文章Unity 保护内存变量 Anti-Cheat Toolkit 反作弊_unity anti-cheat toolkit-CSDN博客

对于unity逆向可以参考这篇文章[Unity逆向 | Lazzaro (lazzzaro.github.io)](https://lazzzaro.github.io/2020/12/13/reverse-Unity逆向/index.html#:~:text=直接运行Il2CppDumper.exe并依次选择il2cpp的可执行文件GameAssembly.dll和global-metadata.dat(文件头 AF 1B,B1 FA)文件,然后根据提示输入相应信息。 程序运行完成后将在当前运行目录下生成输出文件。)对于我的水平来说这题可能会成为待补充的内容了

但按照网上的WP来看,这道题目的解法为:按住W冲出游戏屏幕即可得到flag

image-20240910134511019

等到我的水平能够做到逆向unity编写的exe文件后再来补充其中的逻辑吧...

考点:(待补充)

我爱Linux(较难新工具)

下载文件,是一张打不开的png图片,我们丢进010editor进行分析:

image-20240910142013312

以jpg模板解析发现文件尾存在插入隐藏的内容,我们提取出来:

image-20240910143834876

这是什么文件呢?我们一头雾水,我们使用file命令分析也仅仅说是data数据:

image-20240910143915462

ChatGPT给了我们一个完美的答案:

image-20240910143939186

Python的序列化

Python 的序列化(serialization)是将 Python 对象转换为可以存储或传输的格式的过程,常用的序列化格式包括 JSON、pickle 和 XML 等。

JSON 是易读的文本格式,键值对的形式

Pickle 是二进制格式,内容不可读,保存完整的Python对象

XML 是标记化的文本格式,具有层级结构

既然我们提取出来的是Python代码进行pikle序列化后的不可读文件,在此我们使用pikle库进行反序列化

import pickle

def load_pickle_file(filename):
    """
    加载并反序列化 Pickle 文件。

    :param filename: Pickle 文件的路径
    :return: 反序列化后的 Python 对象
    """
    try:
        # 以二进制模式打开 Pickle 文件
        with open(filename, 'rb') as file:
            # 反序列化文件内容
            data = pickle.load(file)
        return data
    except Exception as e:
        # 如果发生错误,打印错误信息
        print(f"加载 Pickle 文件时出错: {e}")
        return None

def write_to_file(filename, data):
    """
    将数据写入文本文件。

    :param filename: 文本文件的路径
    :param data: 要写入的数据
    """
    with open(filename, 'w') as file:
        # 将数据转换为字符串,并写入文件
        file.write(str(data))

if __name__ == "__main__":
    # 输入文件名,替换为你的 Pickle 文件路径
    input_filename = '无标题1'
    # 输出文件名,数据将被写入到这个文件中
    output_filename = '1.txt'
    
    # 加载并反序列化 Pickle 文件
    deserialized_data = load_pickle_file(input_filename)
    
    # 将反序列化的数据写入到文本文件中
    if deserialized_data is not None:
        write_to_file(output_filename, deserialized_data)
        print(f"数据已被写入到 {output_filename}")

image-20240910145147001

我们可以发现反序列化的数据是列表,这些列表有什么用呢?

按照题目的提示,linux系统下的好玩的命令“sl”其实是一个系统的小彩蛋,执行后会有一个小火车开过:

image-20240910143437961

ASCII字符画

也称为 ASCII 艺术,是一种使用字符和符号来绘制图像的艺术形式。它通常使用 ASCII 字符集中的字母、数字、符号来在文本环境中创建图形。符号图像画广泛应用于早期的计算机程序、电子邮件签名、聊天平台等场合,因为这些场景往往限制了使用图像的能力。

░░▄ ▀▄▄▀▄░░░░░░░░░
░█░░░░░░░░▀▄░░░░░░▄░
█░░▀░░▀░░░░░▀▄▄░░█░█
█░▄░█▀░▄░░░░░░░▀▀░░█
█░░▀▀▀▀░░░░░░░░░░░░█
█░░░░░░░░░░░░░░░░░░█
█░░░░░░░░░░░░░░░░░░█
░█░░▄▄░░▄▄▄▄░░▄▄░░█░
░█░▄▀█░▄▀░░█░▄▀█░▄▀░Fancy ASCII Text Art Gallery (textfancy.com)

那么我们可以推测我们反序列化得到的列表数据排列出来应该就是一个ASCII字符画,我们编写以下脚本进行输出:

# 定义数据列表
data = [[(3, 'm'), (4, '"'), (5, '"'), (8, '"'), (9, '"'), (10, '#'), (31, 'm'), (32, '"'), (33, '"'), (44, 'm'), (45, 'm'), (46, 'm'), (47, 'm'), (50, 'm'), (51, 'm'), (52, 'm'), (53, 'm'), (54, 'm'), (55, 'm'), (58, 'm'), (59, 'm'), (60, 'm'), (61, 'm'), (66, 'm'), (67, '"'), (68, '"'), (75, '#')],
        [(1, 'm'), (2, 'm'), (3, '#'), (4, 'm'), (5, 'm'), (10, '#'), (16, 'm'), (17, 'm'), (18, 'm'), (23, 'm'), (24, 'm'), (25, 'm'), (26, 'm'), (31, '#'), (37, 'm'), (38, 'm'), (39, 'm'), (43, '"'), (47, '"'), (48, '#'), (54, '#'), (55, '"'), (57, '"'), (61, '"'), (62, '#'), (64, 'm'), (65, 'm'), (66, '#'), (67, 'm'), (68, 'm'), (72, 'm'), (73, 'm'), (74, 'm'), (75, '#')],
        [(3, '#'), (10, '#'), (15, '"'), (19, '#'), (22, '#'), (23, '"'), (25, '"'), (26, '#'), (29, 'm'), (30, 'm'), (31, '"'), (36, '"'), (40, '#'), (47, 'm'), (48, '"'), (53, 'm'), (54, '"'), (59, 'm'), (60, 'm'), (61, 'm'), (62, '"'), (66, '#'), (71, '#'), (72, '"'), (74, '"'), (75, '#')],
        [(3, '#'), (10, '#'), (15, 'm'), (16, '"'), (17, '"'), (18, '"'), (19, '#'), (22, '#'), (26, '#'), (31, '#'), (36, 'm'), (37, '"'), (38, '"'), (39, '"'), (40, '#'), (45, 'm'), (46, '"'), (52, 'm'), (53, '"'), (61, '"'), (62, '#'), (66, '#'), (71, '#'), (75, '#')],
        [ (3, '#'), (10, '"'), (11, 'm'), (12, 'm'), (15, '"'), (16, 'm'), (17, 'm'), (18, '"'), (19, '#'), (22, '"'), (23, '#'), (24, 'm'), (25, '"'), (26, '#'), (31, '#'), (36, '"'), (37, 'm'), (38, 'm'), (39, '"'), (40, '#'), (43, 'm'), (44, '#'), (45, 'm'), (46, 'm'), (47, 'm'), (48, 'm'), (51, 'm'), (52, '"'), (57, '"'), (58, 'm'), (59, 'm'), (60, 'm'), (61, '#'), (62, '"'), (66, '#'), (71, '"'), (72, '#'), (73, 'm'), (74, '#'), (75, '#')],
        [(23, 'm'), (26, '#'), (32, '"'), (33, '"')],
        [(24, '"'), (25, '"')],
        [],
        [(12, '#'), (17, 'm'), (18, '"'), (19, '"'), (23, 'm'), (24, 'm'), (25, 'm'), (26, 'm'), (33, '#'), (36, 'm'), (37, 'm'), (38, 'm'), (39, 'm'), (40, 'm'), (41, 'm'), (46, 'm'), (47, 'm'), (52, 'm'), (53, 'm'), (54, 'm'), (65, 'm'), (66, 'm'), (67, 'm'), (68, 'm'), (71, 'm'), (72, 'm'), (73, 'm'), (74, 'm'), (75, 'm'), (76, 'm')],
        [(2, 'm'), (3, 'm'), (4, 'm'), (9, 'm'), (10, 'm'), (11, 'm'), (12, '#'), (15, 'm'), (16, 'm'), (17, '#'), (18, 'm'), (19, 'm'), (22, '"'), (26, '"'), (27, '#'), (30, 'm'), (31, 'm'), (32, 'm'), (33, '#'), (40, '#'), (41, '"'), (45, 'm'), (46, '"'), (47, '#'), (50, 'm'), (51, '"'), (55, '"'), (58, 'm'), (59, 'm'), (60, 'm'), (64, '#'), (65, '"'), (68, '"'), (69, 'm'), (75, '#'), (76, '"')],
        [(1, '#'), (2, '"'), (5, '#'), (8, '#'), (9, '"'), (11, '"'), (12, '#'), (17, '#'), (24, 'm'), (25, 'm'), (26, 'm'), (27, '"'), (29, '#'), (30, '"'), (32, '"'), (33, '#'), (39, 'm'), (40, '"'), (44, '#'), (45, '"'), (47, '#'), (50, '#'), (51, 'm'), (52, '"'), (53, '"'), (54, '#'), (55, 'm'), (57, '#'), (58, '"'), (61, '#'), (64, '#'), (65, 'm'), (68, 'm'), (69, '#'), (74, 'm'), (75, '"')],
        [(1, '#'), (2, '"'), (3, '"'), (4, '"'), (5, '"'), (8, '#'), (12, '#'), (17, '#'), (26, '"'), (27, '#'), (29, '#'), (33, '#'), (38, 'm'), (39, '"'), (43, '#'), (44, 'm'), (45, 'm'), (46, 'm'), (47, '#'), (48, 'm'), (50, '#'), (55, '#'), (57, '#'), (58, '"'), (59, '"'), (60, '"'), (61, '"'), (65, '"'), (66, '"'), (67, '"'), (69, '#'), (73, 'm'), (74, '"')],
        [(1, '"'), (2, '#'), (3, 'm'), (4, 'm'), (5, '"'), (8, '"'), (9, '#'), (10, 'm'), (11, '#'), (12, '#'), (17, '#'), (22, '"'), (23, 'm'), (24, 'm'), (25, 'm'), (26, '#'), (27, '"'), (29, '"'), (30, '#'), (31, 'm'), (32, '#'), (33, '#'), (37, 'm'), (38, '"'), (47, '#'), (51, '#'), (52, 'm'), (53, 'm'), (54, '#'), (55, '"'), (57, '"'), (58, '#'), (59, 'm'), (60, 'm'), (61, '"'), (64, '"'), (65, 'm'), (66, 'm'), (67, 'm'), (68, '"'), (72, 'm'), (73, '"')],
        [],
        [],
        [],
        [(5, '#'), (8, '#'), (16, 'm'), (17, 'm'), (18, 'm'), (19, 'm'), (23, 'm'), (24, 'm'), (25, 'm'), (26, 'm'), (30, 'm'), (31, 'm'), (32, 'm'), (33, 'm'), (38, 'm'), (39, 'm'), (40, 'm'), (50, '#'), (57, '#'), (64, '#'), (71, 'm'), (72, 'm'), (73, 'm')],
        [(2, 'm'), (3, 'm'), (4, 'm'), (5, '#'), (8, '#'), (9, 'm'), (10, 'm'), (11, 'm'), (15, '#'), (16, '"'), (19, '"'), (20, 'm'), (22, 'm'), (23, '"'), (26, '"'), (27, 'm'), (29, '#'), (34, '#'), (36, 'm'), (37, '"'), (41, '"'), (44, 'm'), (45, 'm'), (46, 'm'), (50, '#'), (51, 'm'), (52, 'm'), (53, 'm'), (57, '#'), (58, 'm'), (59, 'm'), (60, 'm'), (64, '#'), (65, 'm'), (66, 'm'), (67, 'm'), (73, '#')],
        [(1, '#'), (2, '"'), (4, '"'), (5, '#'), (8, '#'), (9, '"'), (11, '"'), (12, '#'), (15, '#'), (16, 'm'), (19, 'm'), (20, '#'), (22, '#'), (25, 'm'), (27, '#'), (29, '"'), (30, 'm'), (31, 'm'), (32, 'm'), (33, 'm'), (34, '"'), (36, '#'), (37, 'm'), (38, '"'), (39, '"'), (40, '#'), (41, 'm'), (43, '#'), (44, '"'), (47, '#'), (50, '#'), (51, '"'), (53, '"'), (54, '#'), (57, '#'), (58, '"'), (60, '"'), (61, '#'), (64, '#'), (65, '"'), (67, '"'), (68, '#'), (73, '#')],
        [(1, '#'), (5, '#'), (8, '#'), (12, '#'), (16, '"'), (17, '"'), (18, '"'), (20, '#'), (22, '#'), (27, '#'), (29, '#'), (33, '"'), (34, '#'), (36, '#'), (41, '#'), (43, '#'), (44, '"'), (45, '"'), (46, '"'), (47, '"'), (50, '#'), (54, '#'), (57, '#'), (61, '#'), (64, '#'), (68, '#'), (73, '#')],
        [(1, '"'), (2, '#'), (3, 'm'), (4, '#'), (5, '#'), (8, '#'), (9, '#'), (10, 'm'), (11, '#'), (12, '"'), (15, '"'), (16, 'm'), (17, 'm'), (18, 'm'), (19, '"'), (23, '#'), (24, 'm'), (25, 'm'), (26, '#'), (29, '"'), (30, '#'), (31, 'm'), (32, 'm'), (33, 'm'), (34, '"'), (37, '#'), (38, 'm'), (39, 'm'), (40, '#'), (41, '"'), (43, '"'), (44, '#'), (45, 'm'), (46, 'm'), (47, '"'), (50, '#'), (51, '#'), (52, 'm'), (53, '#'), (54, '"'), (57, '#'), (58, '#'), (59, 'm'), (60, '#'), (61, '"'), (64, '#'), (65, '#'), (66, 'm'), (67, '#'), (68, '"'), (71, 'm'), (72, 'm'), (73, '#'), (74, 'm'), (75, 'm')],
        [],
        [],
        [],
        [(2, 'm'), (3, 'm'), (4, 'm'), (5, 'm'), (8, 'm'), (9, 'm'), (10, 'm'), (11, 'm'), (12, 'm'), (19, '#'), (24, 'm'), (25, 'm'), (26, 'm'), (29, '"'), (30, '"'), (31, 'm')],
        [(1, '#'), (2, '"'), (5, '"'), (6, 'm'), (8, '#'), (16, 'm'), (17, 'm'), (18, 'm'), (19, '#'), (22, 'm'), (23, '"'), (27, '"'), (31, '#')],
        [(1, '#'), (2, 'm'), (5, 'm'), (6, '#'), (8, '"'), (9, '"'), (10, '"'), (11, '"'), (12, 'm'), (13, 'm'), (15, '#'), (16, '"'), (18, '"'), (19, '#'), (22, '#'), (23, 'm'), (24, '"'), (25, '"'), (26, '#'), (27, 'm'), (31, '"'), (32, 'm'), (33, 'm')],
        [(2, '"'), (3, '"'), (4, '"'), (6, '#'), (13, '#'), (15, '#'), (19, '#'), (22, '#'), (27, '#'), (31, '#')],
        [(1, '"'), (2, 'm'), (3, 'm'), (4, 'm'), (5, '"'), (8, '"'), (9, 'm'), (10, 'm'), (11, 'm'), (12, '#'), (13, '"'), (15, '"'), (16, '#'), (17, 'm'), (18, '#'), (19, '#'), (23, '#'), (24, 'm'), (25, 'm'), (26, '#'), (27, '"'), (31, '#')],
        [(29, '"'), (30, '"')]]

# 确定 ASCII 艺术图的大小
width = 80
height = 30

# 初始化一个空白的网格
ascii_art = [[' ' for _ in range(width)] for _ in range(height)]

# 将数据填充到网格中
for y, row in enumerate(data):
    for pos, char in row:
        if pos < width:
            ascii_art[y][pos] = char

# 输出 ASCII 艺术图
for row in ascii_art:
    print("".join(row))

image-20240910152529666

成功得到flag

考点:理解Python序列化、理解ASCII字符画如何由列表输出

补充:一条指令让你成为黑客——打开linux系统输入“hollywood”

[DDCTF2018]第四扩展FS(知识巩固题)

下载文件,是一张jpg格式的图片

按照图片隐写思路,第一步我们查看图片属性发现了如下内容,我们先记录:

image-20240910153739732

我们再优先使用010editor进行分析:

image-20240910153449896

我们发现插入隐藏了数据,但难以手动分离文件,我们使用binwalk:

binwalk -e FS.jpg

我们成功提取出了一个zip文件,我们尝试解压需要密码,经尝试后发现密码就是图片属性中藏着的“Pactera”

里面是一个txt文件:

image-20240910153929993

拖到cyberchef中没有反应,那么我们尝试进行字频统计得到了flag:

image-20240910154023096

考点:文件分离、字频统计

Beautiful_Side(新工具)

下载文件,是一个jpg格式的图片文件

按照图片隐写思路,第一步无果,我们优先使用010editor进行分析:

image-20240910154217544

文件尾部插入隐藏了一张png格式的图片,我们进行提取:

image-20240910154636653

只有半张二维码,这下怎么修复?

二维码分析原理

二维码内部使用了 Reed-Solomon 纠错码,它允许在一定范围内修复丢失或损坏的部分数据。根据二维码的纠错级别,丢失或损坏的数据可以通过剩余的部分被推断出来。

Reed-Solomon 纠错码的工作原理是:它为原始数据添加了冗余信息(纠错码),当部分数据丢失或损坏时,算法通过这些冗余信息来还原原始数据。

这里有一个很好的参考视频【WOE】用肉眼识别二维码,总共分几步?

在此我们可以使用工具QRazyBox进行分析

QRazyBox分析半张二维码原理

QRazyBox 的功能是利用二维码中的纠错码来修复部分损坏的二维码。它通过识别和分析二维码中完好和丢失的部分,将二维码的完整结构和内容还原。

当半张二维码被提供时,QRazyBox 通过分析剩余的部分,利用 Reed-Solomon 算法以及二维码的固定模式(例如定位图形、格式信息区域等)来推断丢失的数据。

对于受损或不完整的部分,QRazyBox 会根据编码规则填补丢失的数据,使二维码可以恢复到足够可以被扫码器识别的程度。

我们打开QRazyBox,创建新的项目,在一旁导入二维码图片按着图片内容一点一点的画图

调整图片大小后,我们通过视频可以明白二维码的 Format Info Pattern(格式信息模式) 是一个 15 位的二进制序列,包含纠错等级和掩模模式,用于帮助解码器正确读取二维码的内容,我们在此设置成和图片一样的格式:

image-20240910163313631

我们尝试画满半张先(建议从右下开始画):

image-20240910164100352

然后再tool工具栏中选择Extract QR Information,开始自动分析隐藏的信息:

image-20240910164759567

我们可以看出解析出的数据为

0100: 这表示数据是以 字节模式(Byte Mode)进行编码的。
000010111: 这表示接下来数据长度为 23 个字节。
0100011001101100011000010110011101111011010011110101000101010111010010010100001101011111001101000100010001010011001100010100000101011111010100110011000000110011001101000101001101111101:二进制后就是flag的值
000011101100:可能代表 终止符 或 错误校正码 的一部分

得到flag

考点:理解二维码修复与分析

[INSHack2018]42.tar.xz(新)

下载文件,是一个42.tar.xz文件

.xz文件

这是一种压缩格式,使用了 LZMA2 压缩算法。它可以将数据压缩得非常小

.tar.xz 文件首先是用 .tar 将文件打包,再使用 .xz 进行压缩,既可以合并多个文件又能节省空间。

我们用7z打开42.tar.xz,发现里面是一层层的压缩包,我们可以使用鼠标连点器连点层层打开直到找到flag我们可以使用以下命令进行循环解压:

while [ "`find . -type f -name '*.tar.xz' | wc -l`" -gt 0 ]; do find -type f -name "*.tar.xz" -exec tar xf '{}' \; -exec rm -- '{}' \;; done;

这是一个 while 循环,其条件是找到 .tar.xz 文件的数量大于 0

find . -type f -name '*.tar.xz'查找当前目录及其子目录下所有扩展名为 .tar.xz 的文件

wc -l 是一个用于统计行数的命令。它会统计 find 命令输出的 .tar.xz 文件的数量

-gt 0

-gt 是 Bash 中的一个运算符,表示 "greater than"(大于)。它用于比较两个数值。

0 表示数字零。条件的意思是:如果找到的 .tar.xz 文件数量大于 0,循环继续执行;否则退出循环。

do

find -type f -name "*.tar.xz" -exec tar xf '{}' \;

​ 再次使用 find 命令,用于在每次循环中查找当前目录及其子目录中的所有 .tar.xz 文件

-execfind 命令的一个选项,它允许在找到的每个文件上执行指定的命令。

{} 是一个占位符,表示当前找到的文件名。

tar xf

x 选项表示解压缩文件。

f 选项表示指定文件名(即 {},找到的 .tar.xz 文件)

\;find -exec 选项的结束符,告诉 find 这是执行命令的结束。

-exec rm -- '{}' \; 再次使用 -exec 选项,在解压缩完成后执行删除操作。删除原始压缩包,可以避免重复处理。

一旦所有 .tar.xz 文件解压并删除完毕,find 命令不会再找到任何 .tar.xz 文件,此时 find . -type f -name '*.tar.xz' | wc -l 的结果为 0,while 条件不再满足,脚本停止执行。

最终我们提取出了许多flag文件:

image-20240910174155238

这些flag文件大小离谱得很,我们使用文本编辑器都难以打开(这里使用了vscode):

image-20240910174908454

可以看出flag文件中藏了许多没用的冗余数据,但我们直接cat flag即可得到flag(使用more flag会更加好)

考点:嵌套压缩包

[BSidesSF2019]diskimage(较难新工具)

下载文件,是一个png格式的文件

按照图片隐写的思路,第一步、第二步无果,我们打开stegsolve打开图片查看:

image-20240911163417985

这次三种颜色的通道的各个平面位上方都存在规律的黑白像素点,貌似都隐藏着消息。我们一个个排列组合过于麻烦,这时就可以使用zsteg来进行自动分析:

zsteg attachment.png -a -v

image-20240911171305659

我们发现了DOS引导扇区文件,可以进行提取

DOS引导扇区(DOS Boot Sector)

是存储在磁盘(如硬盘、软盘或USB驱动器)的第一个扇区,用来引导操作系统。在DOS和其他基于BIOS的操作系统中,BIOS会从引导设备加载引导扇区到内存并执行它,启动系统或加载一个操作系统(它包含一段小型的汇编代码,用于启动操作系统)。该代码会指示计算机找到并加载操作系统内核,或执行其他必要的启动任务。

引导扇区因为其标准的格式和固定的大小,常常用于隐写术。攻击者可以将数据嵌入到空闲的引导扇区中,或者伪装为引导代码中的一部分,而实际运行的是隐写数据。

BIOS(Basic Input/Output System,基本输入输出系统)

是计算机系统中最重要的固件之一,负责在计算机启动时执行初始硬件检查并引导操作系统。

BIOS 是计算机主板上存储在非易失性存储器(通常是 ROM 或 Flash 存储器)中的固件。当用户打开计算机电源时,BIOS 会启动,并执行以下关键功能:

  • 硬件初始化:BIOS 会检测并初始化系统中的硬件设备,例如 CPU、内存、键盘、显示器、存储设备等。
  • 启动自检 (POST, Power-On Self Test):BIOS 在计算机开机时对系统硬件进行自检。如果发现硬件问题,BIOS 会通过发出不同的蜂鸣声或在屏幕上显示错误信息来提示用户。
  • 引导加载程序 (Boot Loader):一旦硬件初始化完成,BIOS 会寻找存储设备中的引导扇区(比如硬盘、光盘或 USB),并将操作系统加载到内存中开始运行。
  • 基本输入输出操作:BIOS 还提供了一些底层的硬件访问接口,例如处理输入设备(键盘)和输出设备(显示器)的基本操作,供操作系统使用。

BIOS 是计算机启动和操作的基础,它为操作系统的加载提供了环境,同时为系统提供了硬件层的控制。虽然现代计算机大多使用 UEFI 替代了 BIOS,但它仍然是理解计算机引导过程和硬件初始化的重要基础知识。

UEFI

UEFI (Unified Extensible Firmware Interface) 是一种现代的计算机系统启动固件接口,它替代了传统的BIOS(Basic Input/Output System)。UEFI在设计上克服了BIOS的一些局限性,并为现代计算机硬件和操作系统提供了更灵活和强大的启动管理能力。

UEFI系统启动时会执行以下功能:

  • 固件初始化:UEFI在计算机启动时初始化硬件,并执行一些自检。
  • 加载UEFI驱动:UEFI固件加载并执行硬件设备的驱动程序,这样系统可以识别并使用硬件。
  • 运行启动管理器:UEFI启动管理器负责查找并启动操作系统引导文件(通常是存放在EFI系统分区中的文件)。
  • 操作系统加载:操作系统的引导程序被加载到内存中并执行,系统启动过程完成。
特点 UEFI BIOS
引导机制 使用EFI文件启动,支持GPT分区表 使用MBR分区表引导
最大支持磁盘容量 超过2TB,最大支持128个分区 最大支持2TB磁盘,最多4个主分区
用户界面 支持图形化用户界面 文本模式界面
启动速度 通常比BIOS更快 相对较慢
安全功能 支持安全启动(Secure Boot) 无内置的安全机制,易受引导区病毒攻击
多操作系统支持 更好地支持多操作系统启动和兼容性 较为简单的多操作系统启动,兼容性较差
扩展性 支持更多的硬件、网络引导和其他现代功能 限制较多,难以支持新硬件

我们可以发现:

.<.~mitsumi.....
...@............
......)./W~NO NA
ME    FAT12   ..
.[|.".t.V.......
^..2.......This 
is not a bootabl
e disk.  Please 
insert a bootabl
e floppy and..pr
ess any key to t
ry again ... .. 	它提示这并不是一个可引导的软盘或存储设备,并且设备未正确配置为引导。这是一个常见的错误信息。如果用户尝试从一个非引导软盘启动,系统会显示这个错误信息。

回到题目,我们对DOS引导扇区进行提取:

zsteg -e "b8,rgb,lsb,xy" attachment.png > DOS

image-20240911172218348

我们挂载DOS引导扇区:

sudo losetup /dev/loop0 attachment.img
sudo mount /dev/loop0 /mnt/

查看内容发现是一堆ICO图片:

image-20240911173639684

没有找到flag,我们推测是被删除了,我们需要尝试恢复文件

为了能够恢复文件,我们可以使用恢复引导扇区数据的工具TestDisk

TestDisk

是一款免费且开源的数据恢复软件,主要用于恢复丢失的分区以及修复无法启动的磁盘。

恢复引导扇区数据的原理

扫描磁盘:TestDisk 首先会扫描磁盘以识别分区和引导扇区。

识别损坏的引导扇区:如果 TestDisk 检测到引导扇区受损或不可读,它会通过分析分区的结构和文件系统元数据来判断问题。

与备份引导扇区对比:TestDisk 会自动检测分区的备份引导扇区(如果存在,在某些文件系统(如FAT和NTFS)中,会存储一个备份的引导扇区。FAT32文件系统将备份引导扇区存放在卷的第6个扇区,而NTFS会在其卷的末端保存备份。),并与主引导扇区进行比较。

恢复或修复

  • 如果备份引导扇区完好无损,TestDisk 可以将其复制到主引导扇区位置,从而恢复引导扇区的正确状态。
  • 如果没有备份引导扇区或备份也受损,TestDisk 可以通过分析文件系统中的现有数据结构,尝试重新生成一个有效的引导扇区。

我们进行恢复数据:

testdisk DOS

image-20240911175641785

这个界面提示我们:

有些磁盘在没有以root用户身份运行时可能不会显示。
恢复过程中,磁盘容量必须被正确检测到,否则可能会影响恢复的成功率。
如果列出的磁盘大小不正确,建议检查硬盘跳线设置、BIOS检测,并安装最新的操作系统补丁和驱动程序。

我们可以选择[Proceed] 继续操作。如果需要提升权限,可以选择 [Sudo] 以管理员权限运行

这里我们选择继续操作:

image-20240911175940683

提示未检测到任何分区表类型(None partition table type has been detected)

我们需要手动选择正确的分区表类型,具体选项包括:

[Intel]:适用于大多数使用 MBR 分区表的 Intel/PC 分区。
[EFI GPT]:适用于使用 GPT 分区表的现代系统(通常是 64 位的 Mac 和一些 x86_64 架构的设备)。
[Humax]:Humax 设备的分区表。
[Mac]:Apple 的旧分区表格式。
[None]:用于没有分区表的设备或媒介(例如一些软盘)。
[Sun]:用于 Sun Solaris 系统。
[XBox]:用于 Xbox 的分区表。

我们按照检测出的选择没有分区表的设备或媒介:

image-20240911180046134

这个界面显示了 TestDisk 已经识别到磁盘上的一个分区,类型为 FAT12 文件系统。FAT12 通常用于早期的软盘(例如 1.44MB 的磁盘)

我们可以进行以下操作:

[Boot]: 检查或修复分区的启动扇区。如果该分区是可启动的,你可以使用这个选项恢复启动扇区。
[Undelete]: 恢复被删除的文件。
[Image Creation]: 创建磁盘或分区的映像文件,用于备份或进一步分析。
[Quit]: 退出当前操作。

我们选择恢复被删除的文件:

image-20240911180451735

找出标红的被删除的文件,按照下面的提示按下C键复制文件:

image-20240911180646062

按照提示再次按下C键即可恢复出文件,得到flag

image-20240911180832595

我们也可以先进行boot操作后进行重建引导扇区,重新构建一键恢复:

image-20240911181034158

[Rebuild BS]:重建引导扇区,如果引导扇区损坏,可以选择这个选项来重新构建。
[List]:查看分区中的文件列表,可能用于检查是否可以恢复文件。
[Dump]:转储扇区数据用于调试。
[Repair FAT]:修复文件分配表(FAT),如果 FAT 文件系统有问题可以尝试修复。

image-20240911181126143

Extrapolated boot sector and current boot sector are different:这意味着推测的引导扇区和当前引导扇区存在差异。通常,这可能意味着引导扇区已损坏或者被修改了,这里是我们已经进行了重建修复了,那么我们可以转储出其中恢复的文件

[Dump]:将数据转储出来,用于进一步调试或分析。
[List]:列出分区中的文件和目录。你可以使用这个选项查看能否访问文件。
[Write]:将修复的引导扇区或其他信息写入磁盘,但这需要谨慎操作。
[Quit]:退出当前操作。

补充:磁盘精灵

一款功能强大的磁盘管理和数据恢复软件,广泛用于磁盘分区管理、数据恢复、磁盘备份与克隆等任务。它不仅适合专业用户进行复杂的磁盘操作,也适用于普通用户对磁盘进行日常管理。

在此我们也可以使用磁盘精灵(破解版)对数据进行恢复(恢复linux系统的EXT 文件系统可能会失效):

image-20240911180217319

image-20240911180235820

考点:LSB隐写、理解DOS引导扇区是什么、使用TestDisk恢复数据

[INSHack2017]hiding-in-plain-sight(知识巩固题)

下载文件,是一个png格式的图片和题目介绍的md文件:

image-20240911182749343

你的智能餐盘有一个嵌入式摄像头,可以拍摄你的饭菜,并自动上传到你的Instagram。然而,你担心它已经被泄露并且正在悄悄地与你的所有追随者分享信息。贝洛是最后一张上网的照片。
在坏人行动之前找到泄露的信息!

第一眼以为要按照这图片进行社工打击吓死我了

按照图片隐写的思路,第一步无果,我们使用010editor打开图片进行分析:

image-20240911182650709

零零散散的模板分析可能藏了东西,我们使用binwalk进行提取:

binwalk -e chall.png

image-20240911183228756

发现存在jpeg文件,但是提取失败了,我们尝试使用foremost

foremost chall.png

image-20240911183343501

成功提取flag

考点:文件分离

[INSHack2017]remote-multimedia-controller(知识巩固题)

下载文件,是一个pcap文件,我们使用wireshark进行分析:

image-20240911183737863

流量包很小,只有54条数据包记录,并且全是使用TCP协议的报文,我们直接追踪流进行分析:

image-20240911183923045

image-20240911183932941

前两个TCP流像是某种交互式命令系统的命令输入和输出,VERS 显示版本,PLAYNEXTQUIT 可能是常见的控制命令

image-20240911184032930

RDBD是远程调试器(Remote Debugger)的缩写,表明这是一个调试会话的输出内容

Command: 0x7ffdff7d2730是一个内存地址,表明可能在调试过程中正在执行某个命令或访问某个内存地址。

client_sd: 4这可能是客户端套接字描述符的值,用于网络通信或进程间通信的调试环境。

后边的乱码字符和十六进制格式的数据看起来像是某种内存转储数据,包括一些特殊字符序列,可能代表二进制数据或某些字符串、指令集等。

总而言之最终回显了flag.txt经编码的值,我们放进cyberchef直接进行解码即可得到flag:

image-20240911184510060

考点:流量分析

[WMCTF2020]行为艺术(新知识巩固题)

下载文件,是一张png格式的图片和提示文本:

image-20240912122942863

提示应该是计算出flag.zip的md5值并给了出来方便我们验证

我们从图片开始分析,第一步将图片拖入tweakpng报错:

image-20240912123130601

按照报错内容crc校验值出错,说明这里存在png宽高隐写内容,我们进行宽高爆破并且进行修改:

image-20240912123340405

image-20240912123445320

我们继续分析图片中的内容,发现开头的50 4B 03 04是zip文件头,所以说明这张图片就是zip压缩文件的16进制内容,我们要一个一个敲吗?也不是不行

这里我们可以使用Python 的 OpenCVPytesseract 库对其中的文字进行自动识别

OpenCV

OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库,用于开发实时图像处理和计算机视觉应用。它由 Intel 于 1999 年开发并发布,现由 OpenCV 社区进行维护。OpenCV 广泛应用于工业、研究、机器人、自动驾驶、图像识别等领域,支持多种编程语言(如 C++、Python、Java 等),并且能够在多个平台上运行(如 Windows、Linux、macOS 和 Android)。

Tesseract

Tesseract 是一个开源的光学字符识别(OCR)引擎,它可以将图像中的文本转换为可编辑的文本格式。它最早由惠普开发,现在由 Google 维护和改进。

下载地址:Home · UB-Mannheim/tesseract Wiki (github.com)

下载后使用以下脚本:

import cv2
import pytesseract
import numpy as np

# 如果你在Windows上,指定Tesseract的路径
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

def preprocess_image(image_path):
    # 读取图像
    image = cv2.imread(image_path)

    # 转为灰度图
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

    # 应用高斯模糊来减少噪声
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)

    # 自适应阈值进行二值化处理
    binary_image = cv2.adaptiveThreshold(blurred, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)

    # 中值滤波进一步去噪
    denoised_image = cv2.medianBlur(binary_image, 3)

    # 形态学操作可以用来增强图像
    kernel = np.ones((2, 2), np.uint8)
    processed_image = cv2.morphologyEx(denoised_image, cv2.MORPH_CLOSE, kernel)

    return processed_image

def recognize_text(image):
    # 使用Tesseract并指定手写字符集。你可以添加更多参数来提高识别效果
    custom_config = r'--oem 1 --psm 6 -c tessedit_char_whitelist=0123456789ABCDEF'

    # 使用 Tesseract 识别文本
    text = pytesseract.image_to_string(image, config=custom_config)

    return text

def main():
    image_path = 'attachment.png'  # 替换为你的图片路径

    # 预处理图像
    processed_image = preprocess_image(image_path)

    # 识别文本
    text = recognize_text(processed_image)

    # 打印识别结果
    print("识别到的文字:")
    print(text)

    # 显示原图和处理后的图像
    cv2.imshow("Original Image", cv2.imread(image_path))
    cv2.imshow("Processed Image", processed_image)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

if __name__ == "__main__":
    main()

但是这里的输出并不正确,因为没有训练集就开始做手写字体的识别是相当有难度的

所以这里就一个个敲了(麻烦的要死了):

504B0304140000000800DB93C55086A3
9007D8000000DF01000008000000666C
61672E74787475504B0E823010DD9370
8771DDCCB0270D5BBD0371815A9148AC
6951C2ED9D271F89C62E2693D7F76BB7
DE9FC80D2E6E68E782A326D2E01F81CE
6D55E76972E9BA7BCCB3ACEF7B89F7B6
E90EA16A6EE2439D45179ECDD1C5CCFB
6B9AA489C1218C92B898779D765FCCBB
58CC920B6662C5F91749931132258F32
BBA7C288C5AE103133106608409DAC41
9F77241A3412907814AB7A922106B8DE
D0D25AEC8A634929025C46A33FE5A1D3
167A100323B1ABEE4A7A0708413A19E1
7718165F5D3E73D577798E36D5144B66
315AAE315078F5E51A29246AF402504B
01021F00140009000800DB93C55086A3
9007D8000000DF010000080024000000
000000002000000000000000666C6167
2E7478740A0020000000000001001800
4A0A9A64243BD601F9D8AB39243BD601
2D00CA13223BD601504B050600000000
010001005A000000FE00000000000000

我们将输出作为十六进制文件编辑,得到zip文件:
image-20240912124904825

我们可以使用cyberchef校验一下发现MD5值正确:

image-20240912125109964

我们尝试进行解压,发现加密了,发现是伪加密,我们修改后进行解压得到编码后的flag:

image-20240912125330246

image-20240912125344857

brainfuck编码老朋友了:

image-20240912125514455

考点:png宽高隐写、使用机器学习库进行图像识别、理解brainfuck编码

[XMAN2018排位赛]AutoKey(新工具知识巩固题)

下载文件,是一个pcapng文件,我们使用wireshark打开:

image-20240912131324767

是USB流量,我们可以看出是键盘流量,使用UsbKeyboardDataHacker脚本进行分析即可:

image-20240912132106514

可以发现输出的内容为:

<CAP>mplrvffczeyoujfjkybxgzvdgqaurkxzolkolvtufblrnjesqitwahxnsijxpnmplshcjbtyhzealogviaaissplfhlfswfehjncrwhtinsmambvexo<DEL>pze<DEL>iz

我们进行处理(<DEL>操作会删除前一个输入的字符):

mplrvffczeyoujfjkybxgzvdgqaurkxzolkolvtufblrnjesqitwahxnsijxpnmplshcjbtyhzealogviaaissplfhlfswfehjncrwhtinsmambvexpziz

看上去是一串密文,我们应该进行解密,但放进cyberchef没有任何反应,按照题目提示我们应该去探索一下什么是AutoKey

AutoKey加密

AutoKey 是一种基于 Vigenère 密码 的加密方式,它属于多表代换密码。与传统的 Vigenère 密码不同,AutoKey 密码通过使用部分明文作为密钥的一部分,从而避免了重复使用短密钥带来的弱点。

这种方式比 Vigenère 密码更安全,但仍然容易受到某些现代密码分析技术(如频率分析)的攻击。

总的来说,AutoKey 是 Vigenère 密码的改进版本,但已经被现代的加密标准(如 AES)所取代。

在此给出破解AutoKey加密的工具脚本(来自Practical Cryptography,配置文件来自Practical Cryptography):

image-20240912172058200

运行脚本在其中发现密钥为“FLAGHERE”的明文,得到flag:

image-20240912172117031

考点:USB流量分析、理解AutoKey加密

[INSHack2018] (not) so deep(新工具知识巩固题)

下载文件,是一个wav格式的音频,听声音是非常奇怪的电磁波声

按照音频隐写的思路,我们使用Audacity分析,在频谱图中发现了一半flag:

image-20240914115709467

第三步无果,我们推测剩下的一半flag使用了特殊工具进行了隐写

按照题目中的“deep”,我们推测使用了deepsound这款音频隐写的工具

DeepSound

DeepSound 是一款用于将秘密信息嵌入音频文件中的隐写工具。它可以将文本、图片或其他文件隐藏在音频文件中,而不会显著影响音频质量。

我们将wav音频导入,发现分析隐藏文件需要密码:

image-20240914123357214

DeepSound 加密使用的密码哈希是可以被破解的,在此我们使用deepsound2john得到音频文件的hash值:

image-20240914121608787

得到hash值后,我们在hashcat的官网上查询相关文件的哈希算法,并没有任何发现,所以这次我们不能使用hashcat进行分析了

那么我们就只能尝试使用默认字典了,我们将hash值存入2.txt中,使用命令:

john 2.txt

image-20240914123059352

我们可以发现john首先是使用了/usr/share/john/password.lst这默认字典,之后通过生成所有可能的 ASCII 字符组合逐步尝试密码,直到找到匹配的密码(一般会破解超级久)

我们得到了密码azerty,导入deepsound:

image-20240914123757329

得到了隐藏文件flag2.txt,点击Extract secret files进行文件分离,打开组合得到flag

考点:理解频谱图、理解工具deepsound、会使用john对hash进行破解

[QCTF2018]X-man-Keyword(新密码脑洞知识巩固孬题)

下载文件,是一张png格式的图片文件,图片中的内容揭示了keyword:lovekfc

按照图片隐写思路,第一步、第二步、第三步无果,那么就是使用了特殊工具的隐写了

我们使用zsteg进行分析:

image-20240914124116613

并没有分析出什么,接下来我们使用cloacked-pixel进行分析:

python2 lsb.py extract attachment.png 1.txt lovekfc

image-20240914134926846

提交发现并不是flag,使用了ROT13爆破都没有得到正确的flag

发现了原题的提示:CTF_competition_warehouse_2018/2018_QCTF/Misc/X-man-Keyword/题目描述.txt at master · securebluefox/CTF_competition_warehouse_2018 (github.com)

image-20240914135237645

按照提示1将keyword放到了flag前面也不是flag

再按照提示2,一种把关键词提前的置换,也就是说keyword作为关键词提前并且是置换密码

那么可能是将“lovekfcabdghijmnpqrstuwxyz”作为了密钥,这可能是一种多表置换的密码

我们可以确定PVSF对应QCTF(查了发现X-man的flag格式)

P经过密钥l加密成了Q

V经过密钥o加密成了C

S经过密钥v加密成了T

F经过密钥e加密成了F

并没有从上面的加密发现相关的规律,在此再次放开了脑洞:

密钥表:lovekfcabdghijmnpqrstuwxyz	P位于17	Q位于18	V位于3	C位于7
字母表:abcdefghijklmnopqrstuvwxyz	P位于16	Q位于17	V位于22	C位于3

可以发现密文在密钥表中的位置对应着明文在字母表中的位置

通过上面的发现我们找出了密文的加密方式,接下来我们就可以编写脚本进行解密了:

def decrypt(ciphertext, key_table, alphabet):
    # 创建密钥表到字母表的映射
    key_to_alpha = {key_table[i]: alphabet[i] for i in range(len(key_table))}

    # 解密密文
    plaintext = ''.join(key_to_alpha.get(char, char) for char in ciphertext)

    return plaintext


# 密钥表和字母表
key_table = 'lovekfcabdghijmnpqrstuwxyzLOVEKFCABDGHIJMNPQRSTUWXYZ'
alphabet = 'abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

# 密文
ciphertext = 'PVSF{vVckHejqBOVX9C1c13GFfkHJrjIQeMwf}'

# 解密
plaintext = decrypt(ciphertext, key_table, alphabet)
print('明文:', plaintext)

image-20240914141846098

得到了flag

考点:使用了特定工具进行的图片文件隐写、脑洞大开想出加密方式

[INSHack2017]10-cl0v3rf13ld-lane-signal(知识巩固题)

下载文件,是一个unk格式的文件和提示文本:

image-20240914142247933

不知道unk是什么格式的文件,我们优先使用010editor进行分析:

image-20240914142437818

看到文件头,原来是jpeg文件,我们修改后缀得到图片,我们继续分析,发现文件尾藏有png图片:

image-20240914142551440

文件分离后得到一张摩斯电码表:

image-20240914142658579

仔细观察发现左下角藏着摩斯电码内容,我们进行解码:

image-20240914142750804

记录下来,说不定是什么密码

我们继续分析png图片,发现文件尾又藏了东西:

image-20240914142843060

OGG格式的音频

这是一种开放容器格式,常用于存储音频数据,如 Vorbis 编码的音频。OGG 文件可以包含多种类型的数据,但最常见的是 Ogg Vorbis 音频。

听一下发现是摩斯电码的信号声,我们使用Audacity进行分析方便我们输出解码得到flag:

image-20240914143120750

image-20240914143151649

考点:文件分离、理解摩斯电码

[MRCTF2020]寻找xxx(知识巩固孬题)

下载文件,发现里面是一个wav格式的音频文件
播放音频,发现是电话拨号音

使用dtmf2num进行分析:

dtmf2num.exe 密码.wav

image-20240914143711087

我们尝试提交,发现并不是flag

我们使用Audacity分析频谱图,发现有很多杂音可能影响了判断:

image-20240914144044589

我们边听边分析,前4个1868应该没有问题,但第5个音明显与第4个音不同,因此“88”这一段可能存在误判,只含有1个8

继续分析,“222”处只出现两个相同的音,因此应该只含有2个2

最后音的数量与输出的数量不一致,应该是被杂音误判了

那么正确输出可能是

18684221609
186842216D9
186842216D0

都不是flag,上网一搜发现要发送给公众号...

image-20240914145534582

考点:理解DTMF拨号音

补充:网上WP使用sonic visualier进行分析

Sonic Visualiser 是一款开源的音频分析工具,专为音乐和音频数据的可视化而设计。它允许用户对音频文件进行详细的分析,支持多种分析和可视化方式。

将音频导入,查看频谱图

image-20240914150212685

配置参数方便分析:

image-20240914150305712

image-20240914150315154

根据左边的频率手动分析出所有DTMF信号,就比如第一个音的高频在1209附近、低频在697附近,因此第一个音分析为1,以此类推

0ad6036ea362440296cd524d9be9011e

同理我们也可使用Audacity分析频谱图,但是不够直观:

image-20240914150908329

一路到底(新)

下载文件,里面一堆txt解压都解压半天:

image-20240914152220027

发现了start.txt

image-20240914152328983

给了我们数字20555,并且给出了下一个文件的地址,我们按照它说的继续探索:

image-20240914152609833

这一次给了我们772,这些数字都是什么意思?

经过探索,我们发现这些数字经过十六进制转换后得到的内容为ZIP文件的文件头(304要补位补成0304):

image-20240914152717241

image-20240914152732618

这样我们就有了清晰的逻辑:从start.txt开始,提取txt中的数字并进行十六进制转换保存到变量中(十六进制转换的值要保存为4字节内容),再提取末尾提取最后 36 个字符作为下一个txt文件的名称来读取下一个txt文件再循环以上步骤

可以编写以下脚本:

import binascii

flag = ''
with open('start.txt') as f:
    cont = f.read()
    next = cont[-36:]  # 提取下一个文件名
    flag += '{:04x}'.format(int(cont[0:cont.find(':')-1]))  # 提取数字并转换为十六进制
    while True:
        path = next
        try:
            with open(path) as f:
                cont = f.read()
                next = cont[-36:]  # 提取下一个文件名
                flag += '{:04x}'.format(int(cont[0:cont.find(':')-1]))  # 提取数字并转换为十六进制
        except :
            break

# 将 flag 写入 1.txt
with open('1.txt', 'w') as f:
    f.write(flag)

(有参考BUUCTF:一路到底_buuctf 一路到底-CSDN博客

image-20240914155113167

我们将输出进行十六进制编辑,得到zip文件,发现加密了

没有任何提示也不是伪加密,我们尝试进行数字密码爆破也没有结果,那么就只能尝试字母与数字组合爆破(最多6位,爆了许久才出来):

image-20240914165430207

我们解压得到png图片,图片打不开,我们使用010editor进行分析发现是文件头被修改的jpg格式的图片,我们修复:

image-20240914155859340

图片中得到了flag

考点:脚本编写、压缩包爆破、图片文件头修复

[羊城杯 2020]signin(较难新脑洞)

下载文件,是含有密文的txt文件:

image-20240914160549172

image-20240914160603041

我们推测这是一段原创的密码,我们应该如何搜索到相关的信息呢?(提示一表人才)

Cryptology ePrint Archive

eprint.iacr.org 是国际应用密码学研究所(IACR)维护的一个在线平台,专门发布密码学领域的预印本(preprints)论文。

All papers (iacr.org)

我们进入网址,搜索与题目相关的关键词并且加上过滤条件:

toy	玩具
Buzz	巴斯
Lightyear	光年
woody	胡迪

image-20240914161239004

找到了这个标题中含有关键词的文章,我们查看:

image-20240914161518480

关键的是这一段替换表,我们按照替换表编写脚本:

dic = {'M':'ACEG','R':'ADEG','K':'BCEG','S':'BDEG','A':'ACEH','B':'ADEH','L':'BCEH','U':'BDEH','D':'ACEI','C':'ADEI','N':'BCEI','V':'BDEI','H':'ACFG','F':'ADFG','O':'BCFG','W':'BDFG','T':'ACFH','G':'ADFH','P':'BCFH','X':'BDFH','E':'ACFI','I':'ADFI','Q':'BCFI','Y':'BDFI'}
text = ''
with open('signin.txt','r') as f:
    f = f.read()
    for i in range(0,len(f),4):
        block = f[i:i+4]
        for j in dic:
            if block == dic[j]:
                text += j
print(text)

image-20240914162417379

我们得到了字符串,提交发现并不是flag

按照提示二表倒立,看不懂捏,但一定是对字符串“LDVUUCMEXMLQSSFUSXKEOCCG”进行的解密操作

羊城杯的flag为“GWHT”我们再将已有信息进行分析:

密码表:MRKSABLUDCNVHFOWTGPXEIQY
密文:LDVUUCMEXMLQSSFUSXKEOCCG
L——G	L位于7	G位于18——倒数第7位
D——W	D位于9	W位于16——倒数第9位
V——H	V位于12	H位于13——倒数第12位
U——T	U位于8	T位于17——倒数第8位

可以发现倒立的意思了,那么我们再写一个替换脚本即可:

dic = {'M':'Y','R':'Q','K':'I','S':'E','A':'X','B':'P','L':'G','U':'T','D':'W','C':'O','N':'F','V':'H','H':'V','F':'N','O':'C','W':'D','T':'U','G':'L','P':'B','X':'A','E':'S','I':'K','Q':'R','Y':'M'}
text = ''
with open('1.txt','r') as f:
    f = f.read()
    for i in range(0,len(f),1):
        block = f[i]
        for j in dic:
            if block == dic[j]:
                text += j
print(text)

image-20240914165038863

成功得到flag

考点:信息收集、脑洞大开

[DASCTF X 0psu3十一月挑战赛|越艰巨·越狂热]签到(简单)

把flag贴你脑门上了

[HDCTF2019]信号分析

下载文件,是一个wav格式的音频,我们尝试听一下好像什么声都没有

我们优先使用Audacity进行分析:

image-20240914165924126

波形图不放大根本看不见,频谱图就有东西藏着

我们尝试一下,发现并不是摩斯电码,我们转换成二进制:

1010101010101000000110	0101010101010101000000110	0101010101010101000000110	0101010101010101000000110(以下省略)

可以发现都是重复的频段(第一段和最后一段首尾相接)

0101010101010101000000110

根据题目名“信号分析”,又让我想起了被电单车支配的恐惧

在此我们对信号进行分析:

image-20240930220803113

image-20240930220810580

我们可以发现这次的信号排列方式符合PT2262系列

image-20240914174005688

我们可以注意到这次没有开始的同步码,我们分析可以得到:

FFFFFFFF0001	停止码

地址码就是flag

考点:理解无线射频信号原理

[SUCTF2018]dead_z3r0(较难新工具知识巩固题)

下载文件,是一个没有后缀的文件,我们优先使用010 editor进行分析:

image-20240921140152154

image-20240921140203116

我们可以发现文件的开头藏有奇怪的看上去像是base64的字符串(尝试使用cyberchef解密失败了),结尾处有一些变量名,可以推测这是pyc文件需要我们反编译

我们尝试使用binwalk和foremost提取其中的pyc文件都失败了,看来只好手动提取了

我们先查一下pyc文件的文件头,要注意pyc文件头与python版本有关(参考文章:Python逆向(二)—— pyc文件结构分析 - Blili - 博客园 (cnblogs.com),也问了chatgpt):

Python 2.7:   03 F3 0D 0A
Python 3.2:   16 0D 0D 0A
Python 3.3:   33 0D 0D 0A
Python 3.4:   42 0D 0D 0A
Python 3.5:   5A 0D 0D 0A
Python 3.6:   33 0D 0D 0A
Python 3.7:   42 0D 0D 0A
Python 3.8:   50 0D 0D 0A
Python 3.9:   51 0D 0D 0A
Python 3.10:  52 0D 0D 0A

我们在文件中找到了python3.6的文件头:

image-20240921143056423

我们提取文件,并给上后缀.pyc,现在我们使用工具进行反编译:

# Visit https://www.lddgo.net/string/pyc-compile-decompile for more information
# Version : Python 3.6


def encryt(key, plain):
    cipher = ''
    for i in range(len(plain)):
        cipher += chr(ord(key[i % len(key)]) ^ ord(plain[i]))
    
    return cipher


def getPlainText():
    plain = ''
# WARNING: Decompyle incomplete


def main():
    key = 'LordCasser'
    plain = getPlainText()
    cipher = encryt(key, plain)
# WARNING: Decompyle incomplete

if __name__ == '__main__':
    main()

有些地方解密的不是很好,在此使用uncompyle6进行反编译

uncompyle6

uncompyle6 是一个用于反编译 Python 字节码(.pyc 文件)并还原为可读 Python 源代码的工具。它支持多种版本的 Python,包括 2.x 和 3.x 系列。

uncompyle6 attachment.pyc

image-20240921145427627

我们可以看出这串代码中使用了encryt方式使用key对plain进行了加密

代码中给出了加密方式:使用key的ascii值与plain的ascii值进行异或加密

题目中没有给出plain的值,我们可以联想到我们最先发现文件的开头藏有奇怪的字符串,应该就是最后经base64编码的密文。

由于异或加密是可逆的,我们直接进行解密:

import base64

key = 'LordCasser'
plain = 'KTswVQk1OgQrOgUVODAKFikZJAUuKzwPCTUxMQE1Kxc8NxYYPjcgQwY7OxMhCzFDLyYFGBYjKwkXMDALAScZEycyJgooOigHEAoSDT42IEcBLCcdDiUxBi8mBRgoLBUKPgowBR04P1QnJj0cLyYFGBYjJBs5JywFL1wjHhkbMkI8KhoWFjAWXH55'
plain = base64.b64decode(plain).decode()
cipher = ''
for i in range(len(plain)):
    cipher += chr(ord(key[i % len(key)]) ^ ord(plain[i]))
print( base64.b64decode(cipher).decode())

image-20240921145713228

最终我们得到了提示:

y0u 4r3 f00l3d
th15 15 n0t that y0u want
90 0n dud3
c4tch th3 st3g05auru5

明文提示我们使用Stegosaurus隐写工具:

./stegosaurus -x attachment.pyc

image-20240921150010658

考点:文件分离、逆向解密、使用stegosaurus工具

[NewStarCTF 2023 公开赛道]流量!鲨鱼!(知识点巩固)

下载文件,发现里面是一个pcap格式的文件,按照数据包分析思路,我们先进行协议分级:

image-20240921150416845

发现HTTP协议发送的data-text-lines占比最多,我们优先过滤查看:

image-20240921150555007

大部分是长度一致的404回显,我们按返回报文的长度排序:

image-20240921150804875

我们可以找到其中使用上传的webshell提取经base64编码的ffffllllllll11111144444GGGGGG文件的回显

我们进行解码即可得到flag

考点:流量分析

[羊城杯 2020]TCP_IP(新孬题)

下载文件,发现里面是一个pcap格式的文件,按照数据包分析思路,我们先进行协议分级:

image-20240921151053578

发现TCP协议发送的Data占比最多,我们优先过滤查看:

image-20240921151212952

可以看出发送的Data内容含有交流,我们进行追踪流分析全是英语对话没啥可在意的

按照题目名称“TCP/IP”提示,我们开始分析tcp报文结构:

image-20240921152402221

1. Source Port(源端口): 1234
表示报文的发送方端口号,源端口为 1234。
2. Destination Port(目的端口): 81
表示报文的接收方端口号,目的端口为 81。
3. Sequence Number(序列号): 1
表示该段的相对序列号,序列号用于确保数据包顺序正确,该报文的序列号是 1。
Next Sequence Number(下一个序列号): 24:表示下一个期望的序列号(当前报文长度为 23 字节,序列号为 1,所以下一个期望序列号为 24)。
4. Acknowledgment Number(确认号): 0
确认号字段用于确认已收到的数据。这里为 0,意味着没有确认数据。
5. Header Length(头部长度): 20 bytes (5)
TCP 头部的长度是 20 字节,对应 5 个 32-bit 字(每个字是 4 字节)。
6. Flags(标志位): 0x008 (PSH)
PSH(Push)标志:表示接收方应立即处理该数据,而不需要等待更多数据的到达。
7. Window Size(窗口大小): 53270
表示发送方当前的接收窗口大小,值为 53270,即接收方能够接受的最大数据量。
8. Checksum(校验和): 0x14e0 (unverified)
TCP 校验和,用于验证数据的完整性。目前状态是未验证的(unverified)。
9. Urgent Pointer(紧急指针): 0
紧急指针用于指示紧急数据的位置。此字段为 0,表明没有紧急数据。
10. TCP Segment Len(TCP 段长度): 23
该 TCP 报文的数据段长度为 23 字节。
11. TCP Payload (23 bytes)
表示报文中实际承载的有效数据长度为 23 字节。

一连看了几个数据包的内容,都没有什么变化

那么我们接下来开始解析IPv4协议:

image-20240921152814227

1. Version: 4
该字段表示 IP 协议的版本。0100 表示 IPv4 协议。
2. Header Length(头部长度): 20 bytes (5)
头部长度为 20 字节。这里的 5 表示头部长度字段以 32 位(4 字节)为单位,5 * 4 = 20 bytes。
3. Differentiated Services Field(区分服务字段): 0x00
该字段包含 DSCP(Differentiated Services Code Point) 和 ECN(Explicit Congestion Notification),用于流量分类和拥塞通知。
DSCP: CS0 (Class Selector 0):表示默认的服务类别。
ECN: Not-ECT:表示没有使用显式拥塞通知。
4. Total Length(总长度): 63
IP 数据包的总长度是 63 字节(包括头部和数据)。
5. Identification(标识符): 0x0040 (64)
标识符用于分片时标识各个数据包,以便在接收端重组数据包。
6. Flags(标志位): 0x0
000:这里的标志位为 0,表示该包不分片。
第一位:保留位(必须为 0)。
第二位:DF(Don't Fragment)位,表示不允许分片,但这里是 0。
第三位:MF(More Fragments)位,表示该数据包是否有后续分片,此处为 0,表示没有更多分片。
7. Fragment Offset(片偏移量): 0
数据包没有分片,因此片偏移量为 0。
8. Time to Live (TTL,生存时间): 255
TTL 值为 255,表示该数据包最多可以经过 255 个路由器节点后被丢弃。TTL 主要用于防止数据包在网络中无限循环。	#之前我们做过TTL隐写的题目要记住
9. Protocol(协议): TCP (6)
协议字段值为 6,表示该 IP 数据包承载的是 TCP 协议的数据。
10. Header Checksum(头部校验和): 0x06a3
该字段用于验证 IP 头部是否正确。此处校验和为 0x06a3,但是校验状态是“未验证”。
11. Stream Index(流索引): 0
表示该数据包属于某个特定的流,该索引为 0。

一连看了几个数据包的内容,我们可以发现标识符一直在改变(源地址ip不同导致),这其中可能蕴含了标识符隐写

标识符隐写

标识符隐写(Identifier Steganography)是一种利用网络协议的标识符字段进行信息隐藏的技术。它属于网络隐写术(Network Steganography)的一种,通过将数据嵌入到通信协议中的特定字段或部分,而不影响正常通信流程。这种技术在不被察觉的情况下隐藏信息,因此可以用于隐蔽通信、信息传输等目的。

我们使用tshark提取其中所有ipv4协议的标识符:

tshark -r attachment.pcap -T fields -e ip.id > 1.txt

提取出的字符进行ascii解码得到:

image-20240921153704022

一串乱码,cyberchef解不开

试了很久,看了别人的WP发型是使用base91解码得到flag

考点:流量分析、理解标识符隐写

[watevrCTF 2019]Unspaellablle(新脑洞)

下载文件,是一串剧本一样的东西:

image-20240921154617088

在文本中搜索flag或ctf未果,我们上网搜索剧本相关的内容:

image-20240921154708476

我们找到了原版剧本:

image-20240921154728912

我们复制文本创建一个新文件,使用notepad++的compare插件将原文与题目进行对比查看哪里有不同的地方:

image-20240921155243106

可以发现除了复制文本格式上的一些不同外,还有一些单词背偷偷修改了,我们一个个查看并提取其中添加的字母:

watevr{icantspeel_tiny.cc/2qtdez}

就是flag

补充

没有这种做题经验正常的思路应该是尝试读一读一些内容,会发现一些单词错误,结合题目名“Unspaellablle”去寻找正确的内容或是使用文本纠错的工具(也许可以我没试过)

考点:文件比较、脑洞大开

[BSidesSF2019]thekey(知识巩固题)

下载文件,是一个pcapng文件,我们使用wireshark打开:

image-20240921161128098

是USB流量,我们可以看出是键盘流量,使用UsbKeyboardDataHacker脚本进行分析即可:

image-20240921161317350

输出的flag有些拼写错误,我们修改成{my_favoritte_editor_is_vim}提交失败

发现要转成大写提交

考点:USB流量分析

[INSHack2019]Passthru(新)

下载文件,里面有提示文件、日志文件和流量包:

image-20240921162644433

你是公司安全团队的一员,管理员最近在公司过滤代理上启用了拦截。

当涉及到域名白名单时,管理员非常自信。

他给了你一次捕获让你回顾。是时候证明他错了。

我们首先协议分级分析流量包:

image-20240921163003334

我们发现HTTP协议占比最高,并且使用了TLS协议加密(Transport Layer security)

没有密钥我们就无法分析HTTP协议的内容,这一次的密钥没有藏在流量包里,这一次我们该如何得到密钥?

wireshark功能九——SSL/TLS调试

在 SSL/TLS 握手过程中,密钥材料会被生成并使用。将这些密钥写入日志文件后,可以在后续的流量捕获中用来解密 TLS 流量。也就是说Wireshark 可以利用 sslkey.log 中的密钥来解密 TLS 流量包。

我们按照导入密钥的步骤来:

image-20240921163430599

我们分析http协议发现了一些参数很长的包,我们重点分析:

image-20240921164355876

(下面 URL 中的 tbs 参数通常是与某种会话、身份验证或数据状态相关的标识符,先不必分析)

image_url=http%3A%2F%2Frequestbin.net%2Fr%2Fzk2s2ezk%3Fid%3D01b77323-6be9-4abd-b427-9f09d992a4df%26kcahsni%3Dce28456a0fd24ac21ec6&encoded_image=&image_content=&filename=&hl=fr

请求了以下参数
image_url
id
kcahsni
encoded_image
image_content
filename
hl=fr	#设置语言为法语(fr)

其中kcahsni参数是不常见的,仔细观察它就是inshack比赛名的倒序,我们应该重点分析

我们将这些参数的值提取出来:

ce28456a0fd24ac21ec6
f2a8c7e8936667dbf7fe
534e490b3295c3d06c24
62646464343732627b41
34656265373037376332
34323166636461643033
30353331373634326335
30663937353965366432
66333861303164636130
f03c0a7d653539616433
1eaf89725ab93968fc52
26cd07e1f71df3dcee9f
9ef773fe97f56554a3b4
a12e3efe4b

我们尝试进行解码:

image-20240921165735132

貌似一堆乱码,但已经出现flag格式{}的雏形了,考虑到参数kcahsni是倒序的inshack,说不定我们解码也需要逆序(在此尝试了多种情况):

image-20240921170000825

image-20240921170713425

最后能够得到flag的情况是按照参数传入顺序倒序读取,最后再进行逆序

考点:理解wireshark的SSL/TLS调试功能、流量分析

[NPUCTF2020]碰上彩虹,吃定彩虹!(很难新工具知识巩固题)

下载文件,里面是三个文件:

image-20240921171750776

从lookatme开始分析,是一串字符串,不知道是密文还是解密用的密码,先记录,并且文件底下存在空格和换行:

image-20240921171839091

进行替换:

image-20240921172102020

尝试摩斯电码:

image-20240921172201971

提示我们这串字符使用了AUTOKEY加密,我们使用脚本进行解密:

image-20240921172923015

"YOUHAVEFOUNDME", CONGRATULATIONSONFINDINGMYSECRETNOWIWILLGIVEYOUTHEPASSWORDITISIAMTHEPASSWD

我们得到了密码IAMTHEPASSWD

再继续分析maybehint.txt,发现是零宽字符隐写。我们使用在线网站解密:

image-20240921173048157

出现了乱码,我们先使用vim观察一下原文:

image-20240921173248060

不懂其中的原理(待补充),只好多次尝试修改设置,最后还是成功得到了提示

image-20240921174624938

image-20240921174713389

提示我们这里存在NTFS隐写,我们使用工具进行查看:

image-20240921175009019

我们得到了隐藏的out.txt文件,里面是一堆字符

我们进行分析,字符串只由几种字符组成:

=
w
Z
l
8
W
c
n
d
j
d
G

我们进行字频统计:

image-20240921175256231

image-20240921175310747

提示为encrypto

encrypto

Encrypto 是一款简单易用的文件加密工具,允许用户通过拖放文件进行加密。它提供强大的加密算法(如 AES-256)来保护文件内容,并支持设置密码以确保安全性。用户可以方便地分享加密文件,接收者需要输入正确的密码才能解密。Encrypto 的界面友好,适合非技术用户,同时也支持高级用户进行自定义设置。它在保护敏感数据和文件共享方面非常实用。

我们继续分析secret文件,文件头MPE1正是经encrypto加密后的文件,后缀为.crypto

image-20240921175629312

image-20240921175743679

使用之前得到的密码,等了半年都解不开。。。

看了网上的WP,是secret文件里面藏了一段。使用strings命令可以看出来:

strings secret.crypto

image-20240921180439802

我们使用010editor对这段进行删除,总算解密成功!得到一张png图片:

image-20240921180629584

按照图片隐写思路,第一步无果,我们使用010editor进行分析发现zip压缩包:

image-20240921180821045

又是加密的压缩包(不是伪加密),我们一边爆破一边继续对图片进行分析,使用stegsolve也没有什么发现,想起了之前做过的题目——很好的色彩呃?

这里可能使用了颜色隐写术:

image-20240921181123718

image-20240921181137625

最后得到

70 40 73 73 57 64

image-20240921181423020

成功解压压缩包得到一个docx文件:

image-20240921181817898

分析密文:

大部分都是小写字母epacisj
大写字母有ALPHUCK

ALPHUCK

ALPHUCK 是一种基于简单加密和隐写术的工具,旨在通过使用字符的替代、变换或排列来隐藏信息。它通常用于创建难以被识别的加密文本,以保护敏感信息。该工具的设计可以包括对字符的替换、伪装和嵌入等技术,使得隐藏的信息在表面上看似无意义,从而提高数据的安全性。

使用在线运行代码的工具得到了flag:

image-20240921182841794

考点:隐藏的摩斯电码、零宽字符隐写、理解NTFS隐写、字频统计、隐藏的十六进制干扰字符、encrypto工具的使用、颜色隐写术、文件分离、理解ALPHUCK代码

[羊城杯 2020]逃离东南亚(较难新知识巩固题)

下载文件,是三个日记的压缩包:

image-20240922001418704

我们从日记1开始分析,里面是一张png格式的图片和日记:

image-20240922001541975

按照图片隐写思路,第一步使用TweakPNG工具发现图片的crc校验出现错误,因此可能存在PNG宽高隐写

image-20240922001624914

修改宽高得到压缩包密码:

image-20240922001831284

成功解压日记2的压缩包,打开发现三个文件:

image-20240922002008615

我们先从test中寻找求救信号吧,使用010editor进行分析:

image-20240922002045769

brainfuck老朋友了,但我们尝试解密出现了乱码:

image-20240922002751070

这时我们需要知道,brainfuck编程语言中[表示开始一个循环,条件是当前内存单元的值不为 0。当内存单元的值为 0 时,循环会结束并跳到相应的 ]。而在开头brainfuck当前内存单元的初始值为0,我们一般使用++++++++进行8次加法操作,表示在当前内存单元中将值增加到8。(不信去看看前面的brainfuck题目都是++++++++开头的)

我们添上,又是得到一串字符:

image-20240922003118275

丢进cyberchef得到了elf程序文件:

image-20240922003202027

提取出来,运行看看:

image-20240922003310749

使用IDE看看也没啥玩意,看来求救信号已经被搞走了:

image-20240922003523281

那么开始从音频分析了,听一下是住手你们不要再打了啦的音频

按照音频隐写思路,第一步、第二步、第三步无果,我们使用steghide无果,那么使用silenteye发现了密码:

image-20240922003902659

解压日记3成功,发现这次给的是个源码文件夹:

image-20240922004020395

按照提示肯定是将求救信息隐藏在其中几个源码文件中了(上百个源码文件。。。)

提示说不能直接明文交流,不能很容易被公司审计专员看出来,那么可能又是一堆空行的内容(空格和tab键的组合),我们需要从.c源码文件中寻找到这些组合

我们可以编写脚本来寻找含有“ \t ”组合的.c文件:

import os

def find_tab_in_c_files(directory):
    # 遍历给定的目录及其子目录
    for root, dirs, files in os.walk(directory):
        for file in files:
            if file.endswith('.c'):  # 只检查以 .c 结尾的文件
                file_path = os.path.join(root, file)
                try:
                    with open(file_path, 'r', encoding='utf-8') as f:
                        content = f.read()
                        if '\t' in content:  # 查找是否包含制表符
                            print(f"Found '\t' in: {file_path}")
                except (UnicodeDecodeError, IOError) as e:
                    print(f"Could not read file: {file_path}, due to {e}")

# 指定你要遍历的文件夹路径
directory = 'C:\Users\SuperSnowSword\Desktop\组会\attachment\日记3\source_code'  # 请将此处替换为实际的文件夹路径
find_tab_in_c_files(directory)

image-20240922005652081

我们从第一个文件开始分析:

image-20240922005934596

我们可以发现所有隐藏的信息都在“}”后边,因此我们可以编写脚本对其进行提取和修改:

def process_c_file(file_path):
    try:
        with open(file_path, 'r', encoding='utf-8') as f:
            lines = f.readlines()

            # 遍历每一行
            for line_num, line in enumerate(lines, 1):
                if '}' in line:
                    # 查找 '}' 的位置
                    index = line.find('}')
                    # 提取 '}' 后面的内容
                    after_brace = line[index + 1:]

                    # 将空格替换为 '0',将制表符替换为 '1'
                    transformed = after_brace.replace(' ', '0').replace('\t', '1')

                    # 输出行号和转换后的结果
                    print(f"Line {line_num}: {transformed.strip()}")

    except (UnicodeDecodeError, IOError) as e:
        print(f"Could not read file: {file_path}, due to {e}")


# 指定1.c文件的路径
file_path = r'C:\Users\SuperSnowSword\Desktop\组会\attachment\日记3\source_code\elf\rtld.c'  # 请将此处替换为实际的文件路径
process_c_file(file_path)

输出不是很好,但我们还是成功提取到了需要的内容

image-20240922010818661

image-20240922010925081

找到求救信号了!我们接下来继续输出剩下文件的内容:

image-20240922011554595

考点:png宽高爆破、理解brainfuck编码、silenteye隐写、多文件分析

[NPUCTF2020]签到(孬题)

下载下来是一个mc地图:

image-20240922011950155

不知道你们玩不玩我的世界,反正我玩。用HMCL启动器打开:

image-20240922012619421

为了防止世界地图出现错误,下载相应版本进行游戏:

image-20240922012957063

这里说要找到灯的开关,但我们先不急,反正是创造模式我们出去看看红石电路:

image-20240922013231973

原理是我们拉下开关后,沙子和龙蛋不断下落,每次都会形成不同的回路:

image-20240922013443815

根据实验可以发现:当红石全灭或全两时,灯泡常亮;当红石只有一边亮时,灯泡闪烁。

沙子使红石亮,龙蛋使红石暗

这样的话就像是做类似于异或操作一样,沙子作为0,龙蛋作为1,不断下落进行计算观察,相同则灯泡常亮记为1;不同则灯泡闪烁记为0

观察了下灯闪烁的结果与外边固定的组合不同(不知道是不是龙蛋和沙子下落时间不同造成了相应的误差)

以灯闪烁的结果为准,录制了视频并进行分析得到了结果:

001110010110000100111001

image-20240922020417756

上网查了才知道原来是要进行md5大写后再提交

考点:玩我的世界

[BSidesSF2020]barcoder(简单)

下载文件,是一张图片和提示:

image-20240922144657297

条形码被遮挡了,但又没有完全遮挡,这就需要我们去手动修复

条形码算是一种一维码,只要有了一部分的宽度就可以尽情修复:

我们先选中一部分未遮挡的内容

image-20240922144939262

然后进行自由变形拉伸即可

image-20240922145627021

(或者是直接用笔工具进行修复也行吧)

image-20240922150622052

使用工具bctester进行扫描即可得到flag

image-20240922151023231

考点:一维码修复

[GKCTF 2021]0.03(知识巩固题)

下载文件,里面是一个无效的zip和secret提示:

image-20240922162827269

我们使用010editor对zip文件进行分析:

image-20240922163359056

没有任何成果,按照压缩包名给出的“flag_in_the_disk”的提示,我们尝试将其作为磁盘进行挂载,由于不知道它使用的文件系统我们先从windows的VeraCrypt开始挂载:

image-20240922163530177

发现需要密码,不输入密码尝试挂载失败,尝试使用secret.txt中的密码进行挂载失败,分析了很久的secret.txt中的密码没有结果,按照txt文件隐藏信息的思路再返回上一层去查看题目给的0.03rar压缩包发现了NTFS隐藏的文件:

image-20240922163749193

image-20240922163809573

又给出一张密码表,数字与表格矩阵形成对应关系:

311——E
223——B
313——C
313——C
112——A
122——F
312——D
312——D
313——C
311——E

成功挂载磁盘得到flag:

image-20240922164137174

考点:NTFS隐写、密码解密、理解磁盘挂载

[INSHack2018]Spreadshit(新知识巩固题)

下载文件,是一个.ods表格和提示文档:

image-20240922170554936

打开表格文件发现什么都没有:

image-20240922170728490

我们全部选中,给字体上所有buff(加粗斜体下划线染色),找到了蹊跷(用边框的滑块找不然office会自动扩展):

image-20240922171638151

找到了由空格组成的信息,我们将含有空格的表格进行填充:

image-20240922172016407

修改表格长宽:

image-20240922172048547

得到flag

考点:理解excel文件隐藏信息的方式

[羊城杯 2020]image_rar(知识巩固孬题)

下载文件,解压是一个mp4文件:

image-20240928221653060

是雷军的经典鬼畜视频,由于时长太长了所以难以逐帧分析,在此我们使用010editor进行分析:

image-20240928221804572

Box[3]后边的内容难以解析了,可能存在插入隐藏的信息,我们使用binwalk分析:

binwalk -e xiao_mi2.mp4

image-20240930182540553

解析出了很多图片文件和一个压缩包:

image-20240930182739928

是bad apple的MV,我们在其中发现了一个无法显示缩略图的图片,我们重点分析(而且几张图片也提示我们重点分享这个文件)

image-20240930191046553

按照图片隐写思路,第一步无果,我们使用010 editor进行分析:

image-20240930183150649

模板无法解析,文件头字符为ara!,没有这种文件头,但能让人联想到rar文件

我们尝试改成Rar!作为文件头,打开文件需要密码

题目没有任何有关密码的提示,我们只好开始爆破,但导入ARCHPR失败了:

image-20240930184150589

我们使用file命令调查文件可以发现,题目给出的rar文件使用的是RAR5。RAR5是WinRAR 5.0及更高版本使用的一种压缩文件格式,它在安全性和压缩算法方面进行了改进,提供了更强的加密和压缩效率,所以ARCHPR难以破解。

image-20240930184349617

RAR5的加密方式没有找到很好的爆破工具,这里就使用hashcat进行爆破

使用以下命令输出rar文件的hash值:

rar2john 65.rar

image-20240930185818940

我们保存rar的hash值至1.txt中然后打开example_hashes hashcat wiki这个网站查找相关文件的哈希算法

image-20240930190144297

编号为13000,我们开始爆破(用了先前的纯数字字典和默认字典失败了,网上说原题有提示密码是GWXXXX)

hashcat -m 13000 -a 3 -o cracked.txt 1.txt GW?a?a?a?a

-a 指定攻击方式,3表示使用掩码攻击

GW?a?a?a?a 指定掩码,?a表示所有可打印字符(大小写字母、数字、特殊字符)

跑了非常非常久猜得到最终的密码:

image-20240930215953764

解压文件,得到一个没有后缀的flag文件,我们使用010editor进行分析:

image-20240930191231050

发现是png图片,我们加上后缀打开即可得到flag:

image-20240930191340982

考点:文件分离、压缩包爆破

[QCTF2018]picture(孬题)

下载文件,是一个没有后缀的文件我们使用010editor进行分析:

image-20240922172723707

是一个png图片,我们加上后缀后继续分析

image-20240922173329447

按照图片隐写思路,第一步、第二步、第三步无果,我们使用zsteg也没有东西,使用cloacked-pixel需要密码

上网查了WP发现,密码就是图片中的文字首字母wwjkwywq

原题的话会有提示:

image-20240922173449135

提示我们文件名里面藏了这个密码

有了提示我们就可以进行解密了:

python2 lsb.py extract attachment.png 1.txt wwjkwywq

image-20240922173748727

1.txt中留下了一大串代码:

#_*_ coding:utf-8 _*_
import re
import sys

# 定义 DES 算法中用到的置换表和 S 盒
# 初始置换表
ip=  (58, 50, 42, 34, 26, 18, 10, 2,
      60, 52, 44, 36, 28, 20, 12, 4,
      62, 54, 46, 38, 30, 22, 14, 6,
      64, 56, 48, 40, 32, 24, 16, 8,
      57, 49, 41, 33, 25, 17, 9 , 1,
      59, 51, 43, 35, 27, 19, 11, 3,
      61, 53, 45, 37, 29, 21, 13, 5,
      63, 55, 47, 39, 31, 23, 15, 7)

# 逆置换表
ip_1=(40, 8, 48, 16, 56, 24, 64, 32,
      39, 7, 47, 15, 55, 23, 63, 31,
      38, 6, 46, 14, 54, 22, 62, 30,
      37, 5, 45, 13, 53, 21, 61, 29,
      36, 4, 44, 12, 52, 20, 60, 28,
      35, 3, 43, 11, 51, 19, 59, 27,
      34, 2, 42, 10, 50, 18, 58, 26,
      33, 1, 41,  9, 49, 17, 57, 25)

# 扩展置换表
e  =(32, 1,  2,  3,  4,  5,  4,  5, 
       6, 7,  8,  9,  8,  9, 10, 11, 
      12,13, 12, 13, 14, 15, 16, 17,
      16,17, 18, 19, 20, 21, 20, 21,
      22, 23, 24, 25,24, 25, 26, 27,
      28, 29,28, 29, 30, 31, 32,  1)

# 置换表
p=(16,  7, 20, 21, 29, 12, 28, 17,
     1, 15, 23, 26,  5, 18, 31, 10, 
     2,  8, 24, 14, 32, 27,  3,  9,
     19, 13, 30, 6, 22, 11,  4,  25)


# S 盒
s=[ [[14, 4, 13,  1,  2, 15, 11,  8,  3, 10,  6, 12,  5,  9,  0,  7],
     [0, 15,  7,  4, 14,  2, 13,  1, 10,  6, 12, 11,  9,  5,  3,  8],
     [4,  1, 14,  8, 13,  6,  2, 11, 15, 12,  9,  7,  3, 10,  5,  0],    
     [15, 12,  8,  2,  4,  9,  1,  7,  5, 11,  3, 14, 10,  0,  6, 13]],

     [[15,  1,  8, 14,  6, 11,  3,  4,  9,  7,  2, 13, 12,  0,  5, 10],     
     [3, 13,  4,  7, 15,  2,  8, 14, 12,  0,  1, 10,  6,  9, 11,  5],     
     [0, 14,  7, 11, 10,  4, 13,  1,  5,  8, 12,  6,  9,  3,  2, 15],     
     [13,  8, 10,  1,  3, 15,  4,  2, 11,  6,  7, 12,  0,  5, 14,  9]],

     [[10,  0,  9, 14,  6,  3, 15,  5,  1, 13, 12,  7, 11,  4,  2,  8],     
     [13,  7,  0,  9,  3,  4,  6, 10,  2,  8,  5, 14, 12, 11, 15,  1],   
     [13,  6,  4,  9,  8, 15,  3,  0, 11,  1,  2, 12,  5, 10, 14,  7],     
     [1, 10, 13,  0,  6,  9,  8,  7,  4, 15, 14,  3, 11,  5,  2, 12]],

    [[7, 13, 14,  3,  0,  6,  9, 10,  1,  2,  8,  5, 11,  12,  4, 15],     
     [13,  8, 11,  5,  6, 15,  0,  3,  4,  7,  2, 12,  1, 10, 14,9],     
     [10,  6,  9,  0, 12, 11,  7, 13, 15,  1,  3, 14,  5,  2,  8,  4],     
     [3, 15,  0,  6, 10,  1, 13,  8,  9,  4,  5, 11, 12,  7,  2, 14]],


    [[2, 12,  4,  1,  7, 10, 11,  6,  8,  5,  3, 15, 13,  0, 14,  9],     
     [14, 11,  2, 12,  4,  7, 13,  1,  5,  0, 15, 10,  3,  9,  8,  6],     
     [4,  2,  1, 11, 10, 13,  7,  8, 15,  9, 12,  5,  6,  3,  0, 14],     
     [11,  8, 12,  7,  1, 14,  2, 13,  6, 15,  0,  9, 10,  4,  5,  3]],

    [[12,  1, 10, 15,  9,  2,  6,  8,  0, 13,  3,  4, 14,  7,  5, 11],
     [10, 15,  4,  2,  7, 12,  9,  5,  6,  1, 13, 14,  0, 11,  3,  8],     
     [9, 14, 15,  5,  2,  8, 12,  3,  7,  0,  4, 10,  1, 13, 11,  6],     
     [4,  3,  2, 12,  9,  5, 15, 10, 11, 14,  1,  7,  6,  0,  8, 13]],

    [[4, 11,  2, 14, 15,  0,  8, 13,  3, 12,  9,  7,  5, 10,  6,  1],     
     [13,  0, 11,  7,  4,  9,  1, 10, 14,  3,  5, 12,  2, 15,  8,  6],     
     [1,  4, 11, 13, 12,  3,  7, 14, 10, 15,  6,  8,  0,  5,  9,  2],     
     [6, 11, 13,  8,  1,  4, 10,  7,  9,  5,  0, 15, 14,  2,  3, 12]],

   [[13,  2,  8,  4,  6, 15, 11,  1, 10,  9,  3, 14,  5,  0, 12,  7],     
     [1, 15, 13,  8, 10,  3,  7,  4, 12,  5,  6, 11,  0, 14,  9,  2],     
     [7, 11,  4,  1,  9, 12, 14,  2,  0,  6, 10, 13, 15,  3,  5,  8],     
     [2,  1, 14,  7,  4, 10,  8, 13, 15, 12,  9,  0,  3,  5,  6, 11]]]

#定义密钥的置换表
pc1=(57, 49, 41, 33, 25, 17,  9,
       1, 58, 50, 42, 34, 26, 18,
      10,  2, 59, 51, 43, 35, 27,
      19, 11,  3, 60, 52, 44, 36,
      63, 55, 47, 39, 31, 23, 15,
       7, 62, 54, 46, 38, 30, 22,
      14,  6, 61, 53, 45, 37, 29,
      21, 13,  5, 28, 20, 12, 4);

pc2= (14, 17, 11, 24,  1,  5,  3, 28,
      15,  6, 21, 10, 23, 19, 12,  4, 
      26,  8, 16,  7, 27, 20, 13,  2, 
      41, 52, 31, 37, 47, 55, 30, 40, 
      51, 45, 33, 48, 44, 49, 39, 56, 
      34, 53, 46, 42, 50, 36, 29, 32)

#定义了每轮中左移的位数
d = (  1,  1,  2,  2,  2,  2,  2,  2, 1, 2, 2, 2, 2, 2, 2, 1)

__all__=['desencode']
class DES():
	'''des 加密'''
	def __init__(self):
		pass
	#加密
	def code(self,from_code,key,code_len,key_len):
		output=""
		trun_len=0
		
		#将密文和密钥转换为二进制
		code_string=self._functionCharToA(from_code,code_len)
		code_key=self._functionCharToA(key,key_len)
		
		#如果密钥长度不是16的整数倍则以增加0的方式变为16的整数倍
		if code_len%16!=0:
			real_len=(code_len/16)*16+16
		else:
			real_len=code_len
		
		if key_len%16!=0:
			key_len=(key_len/16)*16+16
		key_len*=4

		#每个16进制占4位
		trun_len=4*real_len
		#对每64位进行一次加密
		for i in range(0,trun_len,64):
			run_code=code_string[i:i+64]
			l=i%key_len
			run_key=code_key[l:l+64]

			#64位明文、密钥初始置换
			run_code= self._codefirstchange(run_code)
			run_key= self._keyfirstchange(run_key)
			
			#16次迭代
			for j in range(16):
				
				#取出明文左右32位
				code_r=run_code[32:64]
				code_l=run_code[0:32]
					
				#64左右交换
				run_code=code_r
				
				#右边32位扩展置换
				code_r= self._functionE(code_r)
				
				#获取本轮子密钥
				key_l=run_key[0:28]
				key_r=run_key[28:56]
				key_l=key_l[d[j]:28]+key_l[0:d[j]]
				key_r=key_r[d[j]:28]+key_r[0:d[j]]
				run_key=key_l+key_r
				key_y= self._functionKeySecondChange(run_key)

				#异或
				code_r= self._codeyihuo(code_r,key_y)
				
				#S盒代替/选择
				code_r= self._functionS(code_r)
				
				#P转换
				code_r= self._functionP(code_r)
				
				#异或
				code_r= self._codeyihuo(code_l,code_r)
				run_code+=code_r
			#32互换
			code_r=run_code[32:64]
			code_l=run_code[0:32]
			run_code=code_r+code_l
			
			#将二进制转换为16进制、逆初始置换
			output+=self._functionCodeChange(run_code)
		return output

	#异或	
	def _codeyihuo(self,code,key):
		code_len=len(key)
		return_list=''
		for i in range(code_len):
			if code[i]==key[i]:
				return_list+='0'
			else:
				return_list+='1'
		return return_list

	#密文或明文初始置换		 		 							
	def _codefirstchange(self,code):
		changed_code=''
		for i in range(64):
			changed_code+=code[ip[i]-1]
		return changed_code

	#密钥初始置换
	def _keyfirstchange (self,key):
		changed_key=''
		for i in range(56):
			changed_key+=key[pc1[i]-1]
		return changed_key

	#逆初始置换
	def _functionCodeChange(self, code):
		lens=len(code)/4
		return_list=''
		for i in range(lens):
			list=''
			for j in range(4):
				list+=code[ip_1[i*4+j]-1]
			return_list+="%x" %int(list,2)
		return return_list
	
	#扩展置换	
	def _functionE(self,code):
		return_list=''
		for i in range(48):
			return_list+=code[e[i]-1]
		return return_list		
	
	#置换P		
	def _functionP(self,code):
		return_list=''
		for i in range(32):
			return_list+=code[p[i]-1]
		return return_list

	#S盒代替选择置换
	def _functionS(self, key):
		return_list=''
		for i in range(8):
			row=int( str(key[i*6])+str(key[i*6+5]),2)
			raw=int(str( key[i*6+1])+str(key[i*6+2])+str(key[i*6+3])+str(key[i*6+4]),2)
			return_list+=self._functionTos(s[i][row][raw],4)

		return return_list
		
	#密钥置换选择2
	def _functionKeySecondChange(self,key):
		return_list=''
		for i in range(48):
			return_list+=key[pc2[i]-1]
		return return_list
	
	#将十六进制转换为二进制字符串
	def _functionCharToA(self,code,lens):
		return_code=''
		lens=lens%16
		for key in code:
			code_ord=int(key,16)
			return_code+=self._functionTos(code_ord,4)		
		if lens!=0:
			return_code+='0'*(16-lens)*4
		return return_code
	
	#二进制转换
	def _functionTos(self,o,lens):
		return_code=''
		for i in range(lens):
			return_code=str(o>>i &1)+return_code
		return return_code

#将unicode字符转换为16进制
def tohex(string):
	return_string=''
	for i in string:
		return_string+="%02x"%ord(i)
	return return_string
		
def tounicode(string):
	return_string=''
	string_len=len(string)
	for i in range(0,string_len,2):
		return_string+=chr(int(string[i:i+2],16))
	return return_string

#入口函数
def desencode(from_code,key):
	
	#转换为16进制
	from_code=tohex(from_code)
	key=tohex(key)
	
	des=DES()
	key_len=len(key)
	string_len=len(from_code)		
		
	if string_len<1 or key_len<1:
		print 'error input'
		return False
	key_code= des.code(from_code,key,string_len,key_len)
	return key_code


if __name__  == '__main__':
	if(desencode(sys.argv[1],'mtqVwD4JNRjw3bkT9sQ0RYcZaKShU4sf')=='e3fab29a43a70ca72162a132df6ab532535278834e11e6706c61a1a7cefc402c8ecaf601d00eee72'):
		print 'correct.'
	else:
		print 'try again.'

是一串DES加密脚本,密钥为mtqVwD4JNRjw3bkT9sQ0RYcZaKShU4sf,密文为e3fab29a43a70ca72162a132df6ab532535278834e11e6706c61a1a7cefc402c8ecaf601d00eee72

我们使用在线工具解密失败,正常思路是只能根据源码进行逆向解密了(源码地址:):

#_*_ coding:utf-8 _*_
import re
import sys

# 定义 DES 算法中用到的置换表和 S 盒
# 初始置换表
ip=  (58, 50, 42, 34, 26, 18, 10, 2,
      60, 52, 44, 36, 28, 20, 12, 4,
      62, 54, 46, 38, 30, 22, 14, 6,
      64, 56, 48, 40, 32, 24, 16, 8,
      57, 49, 41, 33, 25, 17, 9 , 1,
      59, 51, 43, 35, 27, 19, 11, 3,
      61, 53, 45, 37, 29, 21, 13, 5,
      63, 55, 47, 39, 31, 23, 15, 7)

# 逆置换表
ip_1=(40, 8, 48, 16, 56, 24, 64, 32,
      39, 7, 47, 15, 55, 23, 63, 31,
      38, 6, 46, 14, 54, 22, 62, 30,
      37, 5, 45, 13, 53, 21, 61, 29,
      36, 4, 44, 12, 52, 20, 60, 28,
      35, 3, 43, 11, 51, 19, 59, 27,
      34, 2, 42, 10, 50, 18, 58, 26,
      33, 1, 41,  9, 49, 17, 57, 25)

# 扩展置换表
e  =(32, 1,  2,  3,  4,  5,  4,  5, 
       6, 7,  8,  9,  8,  9, 10, 11, 
      12,13, 12, 13, 14, 15, 16, 17,
      16,17, 18, 19, 20, 21, 20, 21,
      22, 23, 24, 25,24, 25, 26, 27,
      28, 29,28, 29, 30, 31, 32,  1)

# 置换表
p=(16,  7, 20, 21, 29, 12, 28, 17,
     1, 15, 23, 26,  5, 18, 31, 10, 
     2,  8, 24, 14, 32, 27,  3,  9,
     19, 13, 30, 6, 22, 11,  4,  25)


# S 盒
s=[ [[14, 4, 13,  1,  2, 15, 11,  8,  3, 10,  6, 12,  5,  9,  0,  7],
     [0, 15,  7,  4, 14,  2, 13,  1, 10,  6, 12, 11,  9,  5,  3,  8],
     [4,  1, 14,  8, 13,  6,  2, 11, 15, 12,  9,  7,  3, 10,  5,  0],    
     [15, 12,  8,  2,  4,  9,  1,  7,  5, 11,  3, 14, 10,  0,  6, 13]],

     [[15,  1,  8, 14,  6, 11,  3,  4,  9,  7,  2, 13, 12,  0,  5, 10],     
     [3, 13,  4,  7, 15,  2,  8, 14, 12,  0,  1, 10,  6,  9, 11,  5],     
     [0, 14,  7, 11, 10,  4, 13,  1,  5,  8, 12,  6,  9,  3,  2, 15],     
     [13,  8, 10,  1,  3, 15,  4,  2, 11,  6,  7, 12,  0,  5, 14,  9]],

     [[10,  0,  9, 14,  6,  3, 15,  5,  1, 13, 12,  7, 11,  4,  2,  8],     
     [13,  7,  0,  9,  3,  4,  6, 10,  2,  8,  5, 14, 12, 11, 15,  1],   
     [13,  6,  4,  9,  8, 15,  3,  0, 11,  1,  2, 12,  5, 10, 14,  7],     
     [1, 10, 13,  0,  6,  9,  8,  7,  4, 15, 14,  3, 11,  5,  2, 12]],

    [[7, 13, 14,  3,  0,  6,  9, 10,  1,  2,  8,  5, 11,  12,  4, 15],     
     [13,  8, 11,  5,  6, 15,  0,  3,  4,  7,  2, 12,  1, 10, 14,9],     
     [10,  6,  9,  0, 12, 11,  7, 13, 15,  1,  3, 14,  5,  2,  8,  4],     
     [3, 15,  0,  6, 10,  1, 13,  8,  9,  4,  5, 11, 12,  7,  2, 14]],


    [[2, 12,  4,  1,  7, 10, 11,  6,  8,  5,  3, 15, 13,  0, 14,  9],     
     [14, 11,  2, 12,  4,  7, 13,  1,  5,  0, 15, 10,  3,  9,  8,  6],     
     [4,  2,  1, 11, 10, 13,  7,  8, 15,  9, 12,  5,  6,  3,  0, 14],     
     [11,  8, 12,  7,  1, 14,  2, 13,  6, 15,  0,  9, 10,  4,  5,  3]],

    [[12,  1, 10, 15,  9,  2,  6,  8,  0, 13,  3,  4, 14,  7,  5, 11],
     [10, 15,  4,  2,  7, 12,  9,  5,  6,  1, 13, 14,  0, 11,  3,  8],     
     [9, 14, 15,  5,  2,  8, 12,  3,  7,  0,  4, 10,  1, 13, 11,  6],     
     [4,  3,  2, 12,  9,  5, 15, 10, 11, 14,  1,  7,  6,  0,  8, 13]],

    [[4, 11,  2, 14, 15,  0,  8, 13,  3, 12,  9,  7,  5, 10,  6,  1],     
     [13,  0, 11,  7,  4,  9,  1, 10, 14,  3,  5, 12,  2, 15,  8,  6],     
     [1,  4, 11, 13, 12,  3,  7, 14, 10, 15,  6,  8,  0,  5,  9,  2],     
     [6, 11, 13,  8,  1,  4, 10,  7,  9,  5,  0, 15, 14,  2,  3, 12]],

   [[13,  2,  8,  4,  6, 15, 11,  1, 10,  9,  3, 14,  5,  0, 12,  7],     
     [1, 15, 13,  8, 10,  3,  7,  4, 12,  5,  6, 11,  0, 14,  9,  2],     
     [7, 11,  4,  1,  9, 12, 14,  2,  0,  6, 10, 13, 15,  3,  5,  8],     
     [2,  1, 14,  7,  4, 10,  8, 13, 15, 12,  9,  0,  3,  5,  6, 11]]]

#定义密钥的置换表
pc1=(57, 49, 41, 33, 25, 17,  9,
       1, 58, 50, 42, 34, 26, 18,
      10,  2, 59, 51, 43, 35, 27,
      19, 11,  3, 60, 52, 44, 36,
      63, 55, 47, 39, 31, 23, 15,
       7, 62, 54, 46, 38, 30, 22,
      14,  6, 61, 53, 45, 37, 29,
      21, 13,  5, 28, 20, 12, 4);

pc2= (14, 17, 11, 24,  1,  5,  3, 28,
      15,  6, 21, 10, 23, 19, 12,  4, 
      26,  8, 16,  7, 27, 20, 13,  2, 
      41, 52, 31, 37, 47, 55, 30, 40, 
      51, 45, 33, 48, 44, 49, 39, 56, 
      34, 53, 46, 42, 50, 36, 29, 32)

#定义了每轮中左移的位数
d = (  1,  1,  2,  2,  2,  2,  2,  2, 1, 2, 2, 2, 2, 2, 2, 1)

__all__=['desdecode']
class DES():
	'''解密函数,DES加密与解密的方法相差不大
		只是在解密的时候所用的子密钥与加密的子密钥相反
	'''
	def __init__(self):
		pass
	
	def decode(self,string,key,key_len,string_len):
		output=""
		trun_len=0
		num=0
		
		#将密文转换为二进制
		code_string=self._functionCharToA(string,string_len)
		#获取字密钥
		code_key=self._getkey(key,key_len)
				
		
		#如果密钥长度不是16的整数倍则以增加0的方式变为16的整数倍
		real_len=(key_len/16)+1 if key_len%16!=0 else key_len/16
		trun_len=string_len*4
		#对每64位进行一次加密
		for i in range(0,trun_len,64):
			run_code=code_string[i:i+64]
			run_key=code_key[num%real_len]

			#64位明文初始置换
			run_code= self._codefirstchange(run_code)
			
			#16次迭代
			for j in range(16):
				
				code_r=run_code[32:64]
				code_l=run_code[0:32]
				
				#64左右交换	
				run_code=code_r
				
				#右边32位扩展置换
				code_r= self._functionE(code_r)
				
				#获取本轮子密钥
				key_y=run_key[15-j]

				#异或
				code_r= self._codeyihuo(code_r,key_y)
				
				#S盒代替/选择
				code_r= self._functionS(code_r)
				
				#P转换
				code_r= self._functionP(code_r)
				
				#异或
				code_r= self._codeyihuo(code_l,code_r)
				
				run_code+=code_r
			num+=1
			
			#32互换
			code_r=run_code[32:64]
			code_l=run_code[0:32]
			run_code=code_r+code_l
			
			#将二进制转换为16进制、逆初始置换
			output+=self._functionCodeChange(run_code)
		return output
	
	#获取子密钥
	def _getkey(self,key,key_len):
		
		#将密钥转换为二进制
		code_key=self._functionCharToA(key,key_len)
		
		a=['']*16
		real_len=(key_len/16)*16+16 if key_len%16!=0 else key_len

		b=['']*(real_len/16)
		for i in range(real_len/16):
			b[i]=a[:]
		num=0
		trun_len=4*key_len
		for i in range(0,trun_len,64):
			run_key=code_key[i:i+64]
			run_key= self._keyfirstchange(run_key)
			for j in range(16):
				key_l=run_key[0:28]
				key_r=run_key[28:56]
				key_l=key_l[d[j]:28]+key_l[0:d[j]]
				key_r=key_r[d[j]:28]+key_r[0:d[j]]
				run_key=key_l+key_r
				key_y= self._functionKeySecondChange(run_key)
				b[num][j]=key_y[:]
			num+=1

		return b	
		
	#异或	 							
	def _codeyihuo(self,code,key):
		code_len=len(key)
		return_list=''
		for i in range(code_len):
			if code[i]==key[i]:
				return_list+='0'
			else:
				return_list+='1'
		return return_list

	#密文或明文初始置换		 							
	def _codefirstchange(self,code):
		changed_code=''
		for i in range(64):
			changed_code+=code[ip[i]-1]
		return changed_code
		
	#密钥初始置换
	def _keyfirstchange (self,key):
		changed_key=''
		for i in range(56):
			changed_key+=key[pc1[i]-1]
		return changed_key
	
	#逆初始置换
	def _functionCodeChange(self, code):
		return_list=''
		for i in range(16):
			list=''
			for j in range(4):
				list+=code[ip_1[i*4+j]-1]
			return_list+="%x" %int(list,2)
		return return_list
	
	#扩展置换	
	def _functionE(self,code):
		return_list=''
		for i in range(48):
			return_list+=code[e[i]-1]
		return return_list		
	
	#置换P	
	def _functionP(self,code):
		return_list=''
		for i in range(32):
			return_list+=code[p[i]-1]
		return return_list

	#S盒代替选择置换	
	def _functionS(self, key):
		return_list=''
		for i in range(8):
			row=int( str(key[i*6])+str(key[i*6+5]),2)
			raw=int(str( key[i*6+1])+str(key[i*6+2])+str(key[i*6+3])+str(key[i*6+4]),2)
			return_list+=self._functionTos(s[i][row][raw],4)

		return return_list
	
	#密钥置换选择2
	def _functionKeySecondChange(self,key):
		return_list=''
		for i in range(48):
			return_list+=key[pc2[i]-1]
		return return_list
	
	#将十六进制转换为二进制字符串
	def _functionCharToA(self,code,lens):
		return_code=''
		lens=lens%16
		for key in code:
			code_ord=int(key,16)
			return_code+=self._functionTos(code_ord,4)
		
		if lens!=0:
			return_code+='0'*(16-lens)*4
		return return_code
	
	#二进制转换
	def _functionTos(self,o,lens):
		return_code=''
		for i in range(lens):
			return_code=str(o>>i &1)+return_code
		return return_code

#将unicode字符转换为16进制
def tohex(string):
	return_string=''
	for i in string:
		return_string+="%02x"%ord(i)
	return return_string
		
def tounicode(string):
	return_string=''
	string_len=len(string)
	for i in range(0,string_len,2):
		return_string+=chr(int(string[i:i+2],16))
	return return_string
	
#入口函数
def desdecode(from_code,key):
	key=tohex(key)

	des=DES()
	
	key_len=len(key)
	string_len=len(from_code)
	if string_len%16!=0:
		return False
	if string_len<1 or key_len<1:
		return False

	key_code= des.decode(from_code,key,key_len,string_len)
	return tounicode(key_code)

if __name__  == '__main__':
	print("DES 解密\n")
	c=raw_input("请输入密文(长度不限):")
	k=raw_input("请输入密钥(长度不限):")
	print desdecode(c,k)
	k=raw_input("按确定退出")

image-20240930201248314

考点:特殊工具的隐写、理解DES加密

[XMAN2018排位赛]ppap(较难新知识巩固题)

下载文件,发现里面是一个pcap格式的文件,按照数据包分析思路,我们先进行协议分级:

image-20240930203653798

发现TCP协议传输Data数据内容最多,我们直接过滤追踪流观察数据包找到了这个:

image-20240930204033022

除了经base64编码的图片文件,里面还有对话的提示:

yaaaaaaaar, land ho!
Hey wesley, you got that flag?
Ayy, I got yer files right here, matey!
And here be the map to the booty!(注意,这个下面是另一个文件,之前我差点漏掉)
I don't understand, this isn't even a ma-
Yarrrr, the booty be buried by that which the map points to! (no spaces and no caps)Ayy, now I be off. But remember, the factor of scales be 1.02, and the neighborly sorts be limited to 50! Lastly, if ye sail the seven seas, you do be a pirate!

重点提示是其中的“没有空格和大写字母”,这可能是什么密码的提示

image-20240930204839575

image-20240930204901875

使用010editor发现图片还藏有很多东西,我们使用binwalk自动提取:

binwalk -e download.jpg

image-20240930205024260

这里识别出了很多JPG图片却没有输出,用foremost成功了(在使用 binwalk 的时候,-e 选项会尝试提取嵌入的文件,但如果 binwalk 识别到的 JPG 图片没有适当的头尾信息,或者在提取时遇到文件系统的问题,可能就不会输出任何结果。而 foremost 是基于文件头信息来恢复文件的,它会检查文件中的特征并提取所有符合条件的文件类型,因此能成功恢复 JPG 图片)

image-20240930205419784

jpg中有很多图片,zip中是一个加密的压缩包(这里可以直接使用这个网站进行字典查询找到压缩包密码从而得到flagZIP File Password Recovery Online | passwordrecovery.io,以下内容参考文章:BUUCTF-MISC-XMAN2018排位赛]ppap(详细解析)-CSDN博客

image-20240930215132833

但按照流程,我们应该分析一堆图片:

exiftool * > 1.txt

并没有密码相关的信息,我们只好先放弃

回到TCP报文,里面还有一个map to the booty的内容:

image-20240930211638564

这段 XML 文件是 OpenCV 中的 Haar 级联分类器的配置文件,主要用于人脸检测或其他对象检测。

XML 文件中的内容提供了对象检测的模型,我们可以提取其中一个分析一下:

image-20240930214052787

结构为:

<_>
  <maxWeakCount>3</maxWeakCount>
  <stageThreshold>-7.7261334657669067e-01</stageThreshold>
  <weakClassifiers>
    <_>
      <internalNodes>
        0 -1 24 1.3377459347248077e-01</internalNodes>
      <leafValues>
        -6.1252444982528687e-01 9.0941596031188965e-01</leafValues>
    </_>
  </weakClassifiers>
</_>

解析弱分类器

  1. 弱分类器的结构

    • <maxWeakCount>: 该阶段的最大弱分类器数量(这里为 3)。
    • <stageThreshold>: 该阶段的阈值,用于判断分类结果,通常为负值(-0.77)。如果计算结果低于这个值,说明该区域不符合目标(如人脸)。
  2. 内部节点

    • <internalNodes>
      

      : 这是决策树的结构,包含多个参数。以“0 -1 24 1.3377459347248077e-01”为例:

      • 0: 该节点的特征索引。
      • -1: 表示没有子节点,通常表示叶子节点。
      • 24: 代表特征值的阈值索引。
      • 1.3377459347248077e-01: 该特征的阈值,用于判断该特征值与目标的关系。
  3. 叶子值

    • <leafValues>: 包含该弱分类器的输出结果。这里有两个值:-6.1252444982528687e-019.0941596031188965e-01,分别表示当特征值小于阈值时的输出和大于阈值时的输出。

人脸检测的流程

  1. 图像预处理
    • 加载待检测图像并将其转换为灰度图(Haar 特征通常在灰度图上计算)。
  2. 特征提取
    • 级联分类器使用预定义的特征(如 Haar 特征)来分析图像。特征通过内部节点的索引提取。
  3. 弱分类器评估
    • 对每个检测窗口应用多个弱分类器,并根据阈值进行判断。每个弱分类器独立地给出是否为目标(人脸)的判断。
  4. 阶段处理
    • 如果某个阶段的弱分类器结果达不到阈值,则该检测窗口将被丢弃,继续处理下一个窗口。如果多个弱分类器通过,则继续到下一个阶段。
  5. 最终结果
    • 如果最后一个阶段通过,说明在该窗口中检测到了人脸,通常会在图像中用矩形框标记出来。

通过这种方式,级联分类器能够以较高的效率和准确度在图像中检测到人脸或其他目标。

我们使用以下Python 脚本实现对具体图片的处理和检测:

import os
import sys
import cv2  # cv2模块需要自行安装

# 获取所有的图片
imgs = os.listdir('jpg')  # 'jpg'为分离出来的图片文件夹
# 加载用于检测的级联分类器
cascade = cv2.CascadeClassifier('download.xml')  # 'download.xml'为保存的级联分类器文件
# 缩放因子和邻居数参数
scaling_factor = 1.02
min_neighbors = 65  # 提高这个值直到只剩下一张图片

for img_name in imgs:
    # 加载图片并运行级联分类器
    img = cv2.imread(os.path.join('jpg', img_name))  # 'jpg'为分离出来的图片文件夹
    # print img
    detect = cascade.detectMultiScale(img, scaling_factor, min_neighbors)
    if len(detect) > 0:
        print('ok')
        for (x, y, w, h) in detect:
            # 标记检测到的区域
            cv2.line(img, (x, y), (x + w, y + h), (255, 0, 0), 2)
            cv2.line(img, (x, y + h), (x + w, y), (255, 0, 0), 2)
        # 保存处理后的新图片
        cv2.imwrite(os.path.join('123', img_name), img)  # '123'为新建的空文件夹

能发现输出的图片:

image-20240930214833394

于是我们知道了密码skullandcrossbones(就是海盗帽头上的那个)

解压压缩包得到了flag

考点:流量分析、文件分离、压缩包密码爆破、理解级联分类器和python的联动

posted @ 2024-07-22 16:08  Super_Snow_Sword  阅读(1564)  评论(0编辑  收藏  举报