拿到QQ 2005贺岁版后,发现其加密原理并没有新的改变,经过跟踪和分析,编制出暴力破解本地QQ密码的程序。
需要说明的是,我的QQ标本其版本号为12.87.0.8059(按鼠标右键看QQ.exe的属性),如果你手头的版本与我的有差异,请理解我的意图后再动手做实验。
QQ密码在正确登陆后,会将加密的结果保存在用户目录的ewh.db文件中,加密采用公开的MD5算法,通过N次循环以及异或后求反,最终计算出加密的结果,与用户的ewh.db文件中的密文比较后,发出“输入密码与上次成功登录的密码不一致,$
在QQ系统中,“QD”标志代表QQ Data,例如,我们可以在文件User.db或ewh.db中找到这个以QD开头的数据结构。
一、 ewh.db原始数据
51 44 01 01 03 00 04 03 00 BD AF A8 04 00 00 00
00 2E 06 00 07 03 00 B9 AB B4 10 00 00 00 07 22
AA 96 56
其中,红色为AST循环次数,兰色为EWH加密字符串,绿色为UIN QQ号(110340156=0x
二、 ewh.db数据结构
HEX 偏移 |
DEC 偏移 |
数据 |
注释 |
变量 标志 |
0000 |
1 |
51 44 |
QD,QQ Data 数据标志 |
Flag |
0002 |
3 |
01 01 |
保留的数据结构 |
Reserve |
0004 |
5 |
03 00 |
总数据段(Data Sections)的个数 |
Sections |
0006 |
7 |
04 |
第一个数据段(简称1S,下同)的类型,可以从0x01到0x |
Type1S |
0007 |
8 |
03 00 |
1S标志的长度。 |
LenFlag1S |
0009 |
10 |
BD AF A8 |
1S标志(例如AST、UIN、EWH等),是经过简单的异或并求反计算处理的,此处是AST,可能是Algorithm Shift Times 或Axxx Switch Time,管他的呢! |
Flag1S |
|
13 |
04 00 00 00 |
1S数据的长度 |
LenData1S |
0010 |
17 |
00 2E 06 00 = (404992) |
1S数据,这里是进行MD5转换的次数。 这个数据是同计算机的性能有关的,性能越高的计算机,在QQ注册成功后产生的这个循环控制变量就越大。 |
Data1S |
0014 |
21 |
07 |
2S数据的类型,07代表使用MD5进行加密 |
Type2S |
0015 |
22 |
03 00 |
2S标志的长度 |
LenFlag2S |
0017 |
24 |
B9 AB B4 |
2S标志,此处是EWH,代表本数据段是EWH密码数据,可能是Encrypt With Hash的缩写 |
Flag2S |
|
27 |
10 00 00 00 |
2S数据的长度 |
LenData2S |
001E |
31 |
07 22 AA 96 56 82 19 B7 2B BD 2D 34 |
2S数据,是经过MD5加密计算后产生的数据,当然还要经过异或并求反的计算处理,参考下面程序中的1000B858 行代码。 |
Data2S |
002E |
47 |
04 |
3S数据的类型 |
Type3S |
|
48 |
03 00 |
3S标志的长度 |
LenFlag3S |
0031 |
50 |
A9 B5 B2 |
3S标志,此处是UIN,代表本数据段是QQ号码,可能是:User Identifier Number的缩写 |
Flag3S |
0034 |
53 |
04 00 00 00 |
3S数据的长度 |
LenData3S |
0038 |
57 |
|
3S数据, |
Data3S |
三、 加密原理
下面VB伪代码的部分符号引自以上第二点《结构说明》中的变量标志,请注意理解:
Pwd = MD5(Pwd, Len(Pwd))
' Pwd为用户输入的密码,第一轮MD5后,Pwd成为16位字节长度的MD5串。
XorKey As Long = 0 'XorKey为用于解密的字节
For k = 1 To Data1S – 1 '因为前面已经做过一轮,所以此处要减一
Pwd = MD5(Pwd, 16)
Next k
XorKey = XorKey And &HFFFF
XorKey = (LenData2S And &HFF) Xor (LenData2S \ 256)
XorKey = &HFF - XorKey '求反
For k = 1 To 16
Pwd(k) = Pwd(k) Xor XorKey
Next k
If Pwd <> Data2S Then
MsgBox "输入密码与上次成功登录的密码不一致," & vbcrlf & "是否到服务器验证?"
End If
通过以上的流程,我真的佩服QQ的设计者,如此巨大的循环量,加上循环次数的随机性,如果希望产生一个QQ MD5词典简直不可能。虽然理论上,可以产生一个MD5字典,但是,这个字典将有1.15E+77*16个字节之巨,因此,只好根据ewh.db文件提供的数据暴力破解了,不知是不是有更好的方法呢?
不过我的感觉是,循环次数加多了,应该会产生更多的MD5碰撞,不见得是个好事。
还有一种破解思路,也许更加直接,将在后面的文章中详细探讨。但是我只有在有时间做完实验后才有资格评述,不在本文章的讨论范围内。
四、 破解算法
重复进行数十万次MD5加密,会消耗计算机很多时间,如果使用传统的VB或VC,对于一个密码的等待时间也是很可观的(例如使用VB代码,消耗的时间可能是汇编的400倍),因此,我使用汇编语言来编制低层加密解密算法,通过MASM32编译连接,最后用高级语言调用。通过提供算法动态库的方式,方便其他有兴趣的读者自己增加丰富的功能。例如增加多线程等,这也将在以后的探讨中实现。在此不做深入讨论。
附带的例子为VB和VC调用汇编语言动态库的例子,VB代码简单实现了通过密码字典进行单线程破解的功能,读者可以丰富其内容。增加更多的功能。
五、 QQ数据结构分析
下面为动态库BasicCtrlDll.dll中反汇编的代码以及代码分析,主要用于分析EWH.DB中数据结构以及QQ数据解调算法的问题。另外,这个算法也可以将User.db中的数据提取出来。深入研究下去,做一个聊天记录查看器之类的软件也非难事。
1000B71D |
B |
mov eax,BasicCtr |
|
1000B722 |
E8 89460000 |
call BasicCtr.1000FDB0 |
|
1000B727 |
83EC |
sub esp, |
|
1000B |
8B45 08 |
mov eax,dword ptr ss:[ebp+8] |
将数据的开始地址赋给EAX,实际数据为**Data,EAX=*Data |
1000B72D |
53 |
push ebx |
|
1000B72E |
56 |
push esi |
|
1000B |
57 |
push edi |
|
1000B730 |
8B30 |
mov esi,dword ptr ds:[eax] |
需要转换的字符串,EAX指示一个结构,第一个成员为实际的数据指针 |
1000B732 |
894D D8 |
mov dword ptr ss:[ebp-28],ecx |
局部变量[ebp-28]保存全局的标志结构,ECX为全局参数地址,在调用本函数时跟入 |
1000B735 |
8B |
mov eax,dword ptr ds:[esi-8] |
为CString结构中长度的成员,表示总共多少个字节 |
1000B738 |
|
cmp eax,6 |
如果长度小于6,则为无效的数据 |
1000B73B |
|
jb BasicCtr.1000B |
如果比6小则跳转退出,说明数据量不够解调的 |
1000B741 |
803E 51 |
cmp byte ptr ds:[esi],51 |
是否为 QQ Data 的数据,QD为QQ数据标志 |
1000B744 |
|
jnz BasicCtr.1000B |
|
1000B |
807E 01 44 |
cmp byte ptr ds:[esi+1],44 |
|
1000B74E |
|
jnz BasicCtr.1000B |
|
1000B754 |
66:8B7E 04 |
mov di,word ptr ds:[esi+4] |
对于EWH来说,为第4+1个字节,为0003 |
1000B758 |
|
add esi,4 |
指向数据段(Sections)的个数 |
1000B75B |
46 |
inc esi |
|
1000B |
|
add eax,-6 |
EAX去掉6个字节,对于EWH来说,剩下36H个字节 |
1000B |
46 |
inc esi |
|
1000B760 |
8945 08 |
mov dword ptr ss:[ebp+8],eax |
指向第一个数据段 |
1000B763 |
E8 CE050000 |
call BasicCtr.1000BD36 |
在内存(ECX+ |
1000B768 |
8365 E0 00 |
and dword ptr ss:[ebp-20],0 |
局部变量[ebp-20]清零 |
1000B |
0FB |
movzx eax,di |
转换到EAX,对于EWH,di=3。表示有3段数据 |
1000B |
|
test eax,eax |
|
1000B771 |
8945 B8 |
mov dword ptr ss:[ebp-48],eax |
局部变量[ebp-48]保存数据的段数 |
1000B774 |
|
jle BasicCtr.1000B99B |
|
1000B |
837D 08 07 |
cmp dword ptr ss:[ebp+8],7 |
如果整个长度小于7,则剩下的应该是QQ号了。第一次进入时=36H |
1000B77E |
|
jb BasicCtr.1000B |
如果剩余的数据长度小于7则退出 |
1000B784 |
|
mov al,byte ptr ds:[esi] |
第一次进入时,ESI指向第7个数据即数据段的类型,例如 04 |
1000B786 |
66:8B4E 01 |
mov cx,word ptr ds:[esi+1] |
CX=后一个数据,及数据段标志的长度,例如 0003 |
1000B |
46 |
inc esi |
|
1000B78B |
8B55 08 |
mov edx,dword ptr ss:[ebp+8] |
剩余的数据长度,如36H |
1000B78E |
836D 08 03 |
sub dword ptr ss:[ebp+8],3 |
去掉3个,例如成为33H=51 |
1000B792 |
894D C8 |
mov dword ptr ss:[ebp-38],ecx |
局部变量[ebp-38]保存数据段中标志长度 |
1000B795 |
0FB |
movzx edi,cx |
EDI为标志长度了 |
1000B798 |
46 |
inc esi |
|
1000B799 |
8845 E4 |
mov byte ptr ss:[ebp |
局部变量[ebp |
1000B |
8D |
lea ecx,dword ptr ds:[edi+4] |
ECX为取得的标志长度再加上4,例如=7 |
1000B |
46 |
inc esi |
第一次时,ESI指向第一个数据段的标志字段了,例如指向BDAFA8,第9个数据开始 |
1000B |
394D 08 |
cmp dword ptr ss:[ebp+8],ecx |
如果剩余的数据比“标志长度+ |
1000B |
|
jb BasicCtr.1000B |
|
1000B |
8B |
mov ecx,dword ptr ds:[edi+esi] |
跳过数据段的标志部分,将数据段的长度赋值给ECX。例如[edi+esi]=4 |
1000B |
8D |
lea ebx,dword ptr ds:[edi+esi] |
EBX保存新的指针,指向数据段中数据部分的长度部分,例如,[EBX]=4 |
1000B7AF |
895D C4 |
mov dword ptr ss:[ebp |
局部变量[ebp |
1000B7B2 |
8D |
lea ecx,dword ptr ds:[edi+ecx+7] |
从标志(自身长3,加上4个长度位=7)开始,加上数据长度,为完整数据长度。例如E |
1000B7B6 |
3BCA |
cmp ecx,edx |
如果剩下的数据长度(如36H)不够,则退出 |
1000B7B8 |
894D CC |
mov dword ptr ss:[ebp-34],ecx |
局部变量[ebp-34]保存本数据段的总长度 |
1000B7BB |
|
ja BasicCtr.1000B |
如果小于则退出程序 |
1000B |
|
and dword ptr ss:[ebp-10],0 |
局部变量[ebp-10]清零 |
1000B |
|
cmp al,1 |
al保存本段的类型,有效的类型是4或7 |
1000B |
74 18 |
je short BasicCtr.1000B7E1 |
|
1000B |
|
cmp al,2 |
|
1000B7CB |
74 14 |
je short BasicCtr.1000B7E1 |
|
1000B7CD |
|
cmp al,3 |
|
1000B7CF |
74 10 |
je short BasicCtr.1000B7E1 |
|
1000B7D1 |
|
cmp al,4 |
|
1000B7D3 |
74 |
je short BasicCtr.1000B7E1 |
|
1000B7D5 |
|
cmp al,5 |
|
1000B7D7 |
74 08 |
je short BasicCtr.1000B7E1 |
|
1000B7D9 |
|
cmp al,7 |
|
1000B7DB |
74 04 |
je short BasicCtr.1000B7E1 |
|
1000B7DD |
|
cmp al,6 |
|
1000B7DF |
75 19 |
jnz short BasicCtr.1000B7FA |
|
1000B7E1 |
51 |
push ecx |
为本段的总长度,包括(段类型+标志长度+标志+数据长度+数据),例如,对于密码段=1AH |
1000B7E2 |
E8 23430000 |
call <MFC42.operator new> |
|
1000B7E7 |
FF75 CC |
push dword ptr ss:[ebp-34] |
n=[ebp-34],局部变量[ebp-34]保存本数据段的总长度 |
1000B7EA |
8D4E FD |
lea ecx,dword ptr ds:[esi-3] |
[esi-3]指向本段的开始(从段类型算起) |
1000B7ED |
|
mov dword ptr ss:[ebp-10],eax |
局部变量[ebp-10]保存拷贝后的数据 |
1000B |
51 |
push ecx |
src |
1000B |
50 |
push eax |
dest |
1000B |
E8 E5450000 |
call <MSVCRT.memcpy> |
memcpy,将本段的整段数据拷贝到新的地方,数据指针保存在局部变量[ebp-10]中 |
1000B |
|
add esp,10 |
|
1000B7FA |
8B |
mov eax,dword ptr ss:[ebp-38] |
局部变量[ebp-38]保存数据段中标志长度 |
1000B7FD |
|
xor ecx,ecx |
|
1000B7FF |
|
xor al,ah |
将低位长度与高位异或,例如3 xor 0=3 |
1000B801 |
85FF |
test edi,edi |
EDI为标志位的长度 |
1000B803 |
76 12 |
jbe short BasicCtr.1000B817 |
如果本段没有段标志,则跳转 |
1000B805 |
|
mov dl,byte ptr ds:[ecx+esi] |
开始循环,循环次数为标志的长度。ECX第一次时为0,将第一个数据加载到DL中。 |
1000B808 |
32D0 |
xor dl,al |
AL为长度的高位和低位的异或,这里为3 |
1000B |
F6D2 |
not dl |
DL=NOT ([数据] xor [数据段标志长度的高位 xor 数据段标志长度的低位]) |
1000B |
881431 |
mov byte ptr ds:[ecx+esi],dl |
数据保存在原始的内存中相应的地方 |
1000B |
41 |
inc ecx |
|
1000B810 |
3BCF |
cmp ecx,edi |
|
1000B812 |
|
jb short BasicCtr.1000B805 |
|
1000B814 |
8B5D C4 |
mov ebx,dword ptr ss:[ebp |
局部变量[ebp |
1000B817 |
57 |
push edi |
EDI为标志位的长度 |
1000B818 |
56 |
push esi |
ESI为指向解密以后的数据,例如AST |
1000B819 |
8D4D E8 |
lea ecx,dword ptr ss:[ebp-18] |
局部变量[ebp-18]存放强制类型转换以后的数据指针的指针,例如AST |
1000B |
E8 5B430000 |
call <MFC42.CString::CString> |
将解密后的数据变成CString类型。返回的类型放在EAX指示的地址中 |
1000B821 |
8365 FC 00 |
and dword ptr ss:[ebp-4],0 |
局部变量[ebp-4]清零 |
1000B825 |
|
push -4 |
|
1000B827 |
58 |
pop eax |
EAX=-4=FFFFFFFC |
1000B828 |
8BF3 |
mov esi,ebx |
ebx保存数据段中数据部分的长度指针 |
1000B |
2BC7 |
sub eax,edi |
EAX=EAX-EDI=FFFFFFFC-3=FFFFFFF9 |
1000B |
8B1E |
mov ebx,dword ptr ds:[esi] |
ebx为数据段中数据部分的长度了 |
1000B82E |
0145 08 |
add dword ptr ss:[ebp+8],eax |
第一次时,[EBP+8]=33。执行后= |
1000B831 |
|
add esi,4 |
ESI指向数据段中的数据部分了 |
1000B834 |
395D 08 |
cmp dword ptr ss:[ebp+8],ebx |
[ebp+8]= |
1000B837 |
|
jb BasicCtr.1000B |
|
1000B83D |
807D E4 07 |
cmp byte ptr ss:[ebp |
局部变量[ebp |
1000B841 |
74 06 |
je short BasicCtr.1000B849 |
|
1000B843 |
807D E4 06 |
cmp byte ptr ss:[ebp |
如果类型不为6,则执行1000B862 |
1000B847 |
75 19 |
jnz short BasicCtr.1000B862 |
|
1000B849 |
|
mov al,bl |
如果数据段的类型为7,则执行此语句。BL包含本段的长度 |
1000B84B |
33FF |
xor edi,edi |
|
1000B84D |
|
xor al,bh |
al=(长度的低位 xor 长度的高位) |
1000B |
85DB |
test ebx,ebx |
|
1000B851 |
76 |
jbe short BasicCtr.1000B862 |
如果长度为0,则表示没有密码 |
1000B853 |
|
mov cl,byte ptr ds:[edi+esi] |
|
1000B856 |
|
xor cl,al |
|
1000B858 |
F6D1 |
not cl |
DL=NOT ([数据] xor [数据段标志长度的高位xor 数据段标志长度的低位]) |
1000B |
|
mov byte ptr ds:[edi+esi],cl |
|
1000B85D |
47 |
inc edi |
|
1000B85E |
3BFB |
cmp edi,ebx |
|
1000B860 |
|
jb short BasicCtr.1000B853 |
循环直到全部数据解调完毕 |
1000B862 |
53 |
push ebx |
数据串的长度 |
1000B863 |
56 |
push esi |
原始的需要变换的数据 |
1000B864 |
8D4D EC |
lea ecx,dword ptr ss:[ebp-14] |
局部变量[ebp-14]存放强制CString类型转换以后的数据指针的指针,例如DB2E0600 |
1000B867 |
E8 10430000 |
call <MFC42.CString::CString> |
|
1000B |
|
mov al,byte ptr ss:[ebp |
局部变量[ebp |
1000B |
295D 08 |
sub dword ptr ss:[ebp+8],ebx |
去掉已经处理的数据,执行后[ebp+8]=28H,ebx为数据段中数据部分的长度 |
1000B872 |
|
add esi,ebx |
ESI指向下一个数据段的开始部分,ebx保存数据段中数据部分的长度指针 |
1000B874 |
33FF |
xor edi,edi |
|
1000B876 |
|
test al,al |
测试本段的类型是否为0 |
1000B878 |
C645 FC 01 |
mov byte ptr ss:[ebp-4],1 |
局部布尔型变量[ebp-4]=1 |
1000B |
|
jbe BasicCtr.1000BA25 |
如果本段的数据类型为0,则执行1000BA25后退出 |
1000B882 |
|
cmp al,7 |
|
1000B884 |
|
jbe BasicCtr.1000B940 |
如果小于等于7,则跳转到1000B940执行。对于EWH来说就是这样 |
1000B |
|
cmp al,8 |
|
1000B |
|
je BasicCtr.1000BA06 |
如果数据类型为8,则直接退出。 |
1000B892 |
|
cmp al,9 |
|
1000B894 |
74 5D |
je short BasicCtr.1000B |
|
1000B896 |
|
cmp al, |
|
1000B898 |
|
jnz BasicCtr.1000BA25 |
|
1000B89E |
8B4D D8 |
mov ecx,dword ptr ss:[ebp-28] |
当数据类型为A时,执行本程序代码 |
1000B |
8D45 D4 |
lea eax,dword ptr ss:[ebp |
|
1000B |
50 |
push eax |
|
此处删除了若干个字,没有阴私,只是不想文章太长…… | |||
1000B93E |
EB AC |
jmp short BasicCtr.1000B8EC |
|
1000B940 |
|
push 1 |
当数据段的类型<=7时,直接从此处执行 |
1000B942 |
|
pop edi |
|
1000B943 |
8B5D D8 |
mov ebx,dword ptr ss:[ebp-28] |
局部变量[ebp-28]保存全局的标志结构 |
1000B946 |
8D45 EC |
lea eax,dword ptr ss:[ebp-14] |
局部变量[ebp-14]存放强制类型转换以后的数据指针的指针,例如DB2E0600 |
1000B949 |
50 |
push eax |
EAX存放强制类型转换以后的数据指针 |
1000B |
8D45 E8 |
lea eax,dword ptr ss:[ebp-18] |
局部变量[ebp-18]存放强制类型转换以后的数据指针的指针,例如AST |
1000B94D |
FF75 E4 |
push dword ptr ss:[ebp |
局部变量[ebp |
1000B950 |
8BCB |
mov ecx,ebx |
|
1000B952 |
50 |
push eax |
|
1000B953 |
E8 B4FCFFFF |
call BasicCtr.1000B |
call 1000B |
1000B958 |
85FF |
test edi,edi |
|
1000B |
74 18 |
je short BasicCtr.1000B974 |
|
1000B |
8B45 E0 |
mov eax,dword ptr ss:[ebp-20] |
局部变量[ebp-28]第一次为0,为一个计数器 |
1000B |
8B4B 64 |
mov ecx,dword ptr ds:[ebx+64] |
存在于标志结构中,为一个全局地址 |
1000B962 |
8B |
mov edx,dword ptr ss:[ebp-10] |
局部变量[ebp-10]保存拷贝后的数据,即没有经过处理的。例如040300BDAF…… |
1000B965 |
C1E0 02 |
shl eax,2 |
EAX=EAX*2 |
1000B968 |
891401 |
mov dword ptr ds:[ecx+eax],edx |
将未做解调的原始数据放到全局结构中某个指针指示的内存中 |
1000B96B |
8B4B 78 |
mov ecx,dword ptr ds:[ebx+78] |
存在于标志结构中,为一个全局地址 |
1000B96E |
8B55 CC |
mov edx,dword ptr ss:[ebp-34] |
局部变量[ebp-34]保存本数据段的总长度 |
1000B971 |
891401 |
mov dword ptr ds:[ecx+eax],edx |
将数据长度放到全局结构中某个指针指示的内存中 |
1000B974 |
8065 FC 00 |
and byte ptr ss:[ebp-4],0 |
局部布尔型变量[ebp-4]=0 |
1000B978 |
8D4D EC |
lea ecx,dword ptr ss:[ebp-14] |
|
1000B97B |
E8 |
call <MFC42.CString::~CString> |
清除数据段中的数据部分CString |
1000B980 |
834D FC FF |
or dword ptr ss:[ebp-4],FFFFFFFF |
局部布尔型变量[ebp-4]=-1,为True |
1000B984 |
8D4D E8 |
lea ecx,dword ptr ss:[ebp-18] |
|
1000B987 |
E8 10400000 |
call <MFC42.CString::~CString> |
清除数据段中的标志部分CString,例如AST |
1000B |
FF45 E0 |
inc dword ptr ss:[ebp-20] |
局部变量[ebp-28]计数器加一 |
1000B |
8B45 E0 |
mov eax,dword ptr ss:[ebp-20] |
|
1000B992 |
3B45 B8 |
cmp eax,dword ptr ss:[ebp-48] |
局部变量[ebp-48]保存数据的段数 |
1000B995 |
|
jl BasicCtr.1000B |
循环解调每个数据段 |
1000B99B |
8B45 08 |
mov eax,dword ptr ss:[ebp+8] |
最后剩余的长度 |
1000B99E |
F7D8 |
neg eax |
|
此处删除了几百个字,同上 …… | |||
1000BA25 |
8065 FC 00 |
and byte ptr ss:[ebp-4],0 |
|
1000BA29 |
8D4D EC |
lea ecx,dword ptr ss:[ebp-14] |
|
1000BA |
E8 6B |
call <MFC42.CString::~CString> |
|
1000BA31 |
EB 83 |
jmp short BasicCtr.1000B9B6 |
|
以上代码看不懂没关系,在压缩包中的VB代码 LoAnalysisQD (fbyt() As Byte) 函数概括了上述的思想,不过,对于4和7以外的数据类型,由于与本文内容无关,因此,不深入分析。
六、 QQ的另类破解
1、QQ密码算法和身份验证中存在的问题
搞个几十万次加密其实并不能阻止密码的破解,我对现在收集的EWH.db进行统计,那个循环的AST都在40万以上(可以买房子了,不是么?),因此,只要做一个40万的QQ Hash词典,在此基础上进行破解,破解速度不就提高了几万倍么?
这个词典如何形成?问得好!事实上,国际上有合作破解的先例。例如,可以给我分配000000000~999999999的段进行计算,给你分配999999999~1999999999的段进行计算……,最后,将所有结果合成为一个词典(或者根本不用合成,把Hash值发给大家就可以了,总有人能中大奖:)。
这个词典称为Hash词典,大致上是这样的(密码经过400000次加密后得到):
索引(密码) |
Hash值(加密后的密文) |
1 |
2E62CD |
2 |
|
3 |
8FE71CEF95D |
…… |
…… |
999999999 |
A |
有了这个Hash词典,我们完全没有必要重新忍受漫长的计算过程,直接查表就可以了,不是吗?用黑客的行话来说,就是跑字典了。
利用压缩包中提供的函数QQMD5(unsigned char *, long, long, QQSum *),就完全可以形成这个词典了。
别笑,这好象是大炮打蚊子,对于一个小小的QQ来说,何必劳驾全世界呢?既然这是我们闲得无聊下来干的事,我们就该自己来做。
最简单的Hash词典就是利用黑客词典(网上简直多如牛毛)再通过QQMD5函数来生成,如果你想到用数据库来管理这些Hash值,你一定是个非常敬业的黑客,不过数据库也是TB级的了。
Hash散列算法非常容易产生碰撞,如果你偶尔发现输入12345和输入78952一样可以登录QQ,你千万不要怪腾讯公司没水平,这是因为12345和78952产生的Hash相同(别试,我随便说的两个数),这说明,一个Hash输出可能对应多个输入,这就是碰撞。听说山东大学的王教授就很擅长产生这种碰撞,强烈要求他来做我们的斑竹。
因为碰撞,我们的词典就会小一点,不过,这些理想和共产主义一样,离我们很远,即使
况且,现在很多的及时通讯系统都采用本地和服务器联合验证的方式,这非常有效,即使本地的密码被攻破了,但是,不能保证服务器的也被攻破。因为,通过暴力方式破解的登录口令也只是众多产生碰撞的口令之一,如果使用不同的加密方式,即使这个口令能进入本地系统,但是不能保证同一个口令在服务器端得到验证。所以,QQ从这个意义上说,依然是相对安全的(不过众多口令中,可能就只有一个特别象口令)。
如果我是腾讯的老总,说实话,在我垄断市场的情况下,我并不希望自己的口令体系多么坚不可摧,用户有了危机感,我才能从用户手中收取保护费吧:)所以,诸如此类的文章或者工具即使漫天飞也只是帮他做市场而已。
刚才提到密码算法的问题,谈到的所有问题都是本地的密码机制,对于网络之间的报文,采用的又是TEA的加密算法。这个是我后面的文章要分析的。
在QQ的身份验证中,还存在另外一个漏洞,这个漏洞很早就被发现了,一直保留到现在,也许将来也不会改变。
我不说大家也都知道,将EWH.DB中的QQ号(第一点中的那个
从低层的逻辑也可以看得出来,只要用户的EWH.DB文件符合我们前面的算法,QQ就认为这个用户是合法的。因此,我们完全可以想象,如果我自己做一个EWH.DB文件,让那个40万次的东西变成0,岂不是可以让我的计算机从那个傻呼呼的循环中解脱出来吗?更懒的人可能想到,如果不用密码岂不是更爽?好,我们来实现这个愿望:
运行QQPwdFinality.exe,将登录口令中的“12345”删掉,将“循环次数”改为0,进行单步计算后,是不是得到了一个串?如果你的计算机没骗你的话,大家应该都得到同一个结果:3BF2633660EF5DEB066FE6770317AD91,好了,我们将这个结果替换掉EWH.DB中的那个Hash值07 22 AA 96 56
51 44 01 01 03 00 04 03 00 BD AF A8 04 00 00 00
00 00 00 00 07 03 00 B9 AB B4 10 00 00 00 3B F2
63 36 60 EF 5D EB 06
我知道在座的懒人很多(包括我自己),我特地在QQPwdFinality.exe文件中加入了一个“产生EWH.DB文件”选项,我知道你可能连这都懒得勾,所以默认情况下,我帮你勾上了。 你可以选择任何口令和循环次数来形成EWH.DB文件,文件会生成在当前的目录下。
好了,现在,你再也不用拿着你那个EWH.DB文件到处奔波了,你就用这个吧,毛爷爷不是说过吗?打击敌人的同时还要保护自己,你用自己的口令到处看别人的记录,查出来多不好,况且,一旦忘记删掉了,被受害者拿去,访高手找名人,那你就可能重新申请QQ号了。不过,如果按照这个原理将自己的QQ改造一下,你就比任何人都更快地进入QQ,抢先零点几秒找到PLMM。但是千万别干坏事哦,如果你将别人的AST改成FFFFFF
其实,腾讯稍做努力便可以改掉这个问题,要么在每个QQ Data结构后面加一个Hash验证,要么将用户的QQ号作为密钥,对口令进行加密。最简单的就是用QQ号取代MD5算法中的那个基本字串(即便那几十万个循环中用了一次),这样,自己的EWH.DB就只能自己用了,这才是数字指纹的真正用途嘛。也许你会说,这么做知道了算法还是徒劳,但是,至少可以打破现在的局面——只要会用鼠标的都可以修改EWH.DB,显得这些研究破解的同志多么没有存在的价值啊。
以上谈的这些东西总的说起来都是一些雕虫小技,估计有一半的人看到中途就睡着了,坚持下来的请跟随我进入下一个章节,如果最后还有幸存者,我希望和你交个朋友:)
谈到这里,我想,这篇文章不太适合高手拜读,如果你是高手并且很无聊地走到这里,那么,你可以休息了,走的时候别忘记关灯关门哦。
下面,我们主要谈谈关于网络的话题。
2、QQ网络登录时存在的问题
MD5的算法固然不错,但并不能取代传统的算法,那种可逆算法在任何时候都是必要的,特别在网络里。我们可以反证一下,如果你在注册QQ或者修改密码的时候,腾讯公司得到的是MD5 Hash,他怎么能知道你原来的密码是多少呢?他绝对不会和我们一样傻,通过暴力破解的方式得到吧。当然,腾讯公司也可以只要MD5,如果是这样,他就等于失去了一次对用户的隐私进行窥探的机会,这对于任何一个公司来说都是不可能的。
退一步说,即使有的公司宣布,为了用户利益,对用户的密码不感兴趣,但是,他还是要知道是谁采用了合法的方式登录,因此,最终都不能免俗,都必须从用户发来的网络包中提取信息来完成身份的校验,以便对上帝们发出邀请或对恶魔们进行拒绝,OK,如果魔鬼扮成上帝呢?
有两种方法可以假扮上帝(如果真的有God,我在这里用您老人家做比喻希望能得到宽恕,amen):第一种,绑架他,然后伪装成他;第二种,分析其DNA结构,最后人工合成一个(Sorry,这是最后一次拿您做比较,保证以后不再,amen)。
第一种方法其实是比较复杂的,通过截获TCP或UDP包,然后对包重定向,截获控制权等等,既需要技巧又需要耐心,还需要一点运气,做之前别忘记向全能的上帝祷告一下,让他帮助你猜中下一个TCP的序列号,自己研究吧。
这篇杂文主要讲第二种方法,通过对认证过程的研究最后合成自己的发送包,或者对截获的网络包进行分析,找出包主的登录密码或者其他信息。
关于网络包的截取有三种方法:
1、捕捉WSock32的传输函数
2、使用专用的安全工具例如NetXray或者Sniffer
3、用开发包自己做,例如WinPcap开发套件
我一般使用Sniffer工具,有工具不用,拿武汉话说叫苕货。记得93年时写网卡驱动程序的时候了,那个时候主要研究怎样将网卡改装成嗅包器,来对校园网的流量进行计费,很遥远的事情了。现在真好工具真多!
下面,我们来看一看服务器与客户机之间的对话:
第一次,当故意输入错误的密码登陆时,UDP会话如下:
发给服务器: |
02 |
服务器返回: |
02 00 00 00 31 00 05 01 00 03 |
发给服务器: |
02 |
服务器返回: |
02 00 00 00 62 06 08 00 18 |
发给服务器: |
02 |
服务器返回: |
02 01 00 00 18 06 08 92 78 52 77 50 d8 01 78 02 ff |
这些信息中肯定包含登录数据,于是,通过尝试不同的密码,最后输入一次正确的密码,比较这些数据(过程就不罗嗦了,一些基本的技巧例如通过弹出的错误对话框倒推到数据比较直到密码数据的合成;跟踪重要的网络动态库WSock32的调用等),最终将登录过程搞得清清楚楚明明白白真真切切。
在BasicCtrlDll.dll的代码位置100025EA处,有指令call BasicCtr.1000EB21
在反汇编代码中,几个参数为:
call BasicCtr.1000EB21([EBP+C],[EBP+10], BasicCtr.100127B8,ESI, [EBP-20])
本函数参数的意义参考下面:
BasicCtr.1000EB21(明文,明文长度, 密钥, 密文, 密文长度)
因此,可以考虑以下方案来形成自己的加密或解密代码:
1、自己写代码;2、直接利用动态库的代码(把内部代码看成黑匣子)
自己写代码,必须跟踪并弄清楚整个算法,如果我们偷个懒直接利用这个函数呢?现在是讲究效率的年代,除非这个加解密算法写的很精彩,否则,没必要浪费时间来深入分析。
不过,在没有弄清楚整个加解密思想之前,我们还得下一番功夫,根据我的研究,腾讯的通讯数据包使用的是TEA加密算法,他在这个加密算法上玩了几个花样,企图迷惑我们这些高级一点的菜鸟,不过,这些措施好像不能阻挡菜鸟来研究它,因为菜鸟见过比这更复杂的东东,好了,不多聊(聊多了成灌水的了:)。这个花样就是通过WSock32库附带的函数WSOCK32.ntohl打乱加密的数据,加密后又使用WSOCK32.ntohl函数还原,这应该是一种变形的TEA算法吧。另一方面,为了让每次加密的结果截然不同,程序还使用了随机密钥来辅助加密数据(我发现腾讯很喜欢反复加密的方式,有个性!)。不过,菜鸟有菜办法,我们不深入研究好了吧,我们不想盗版,我们只想盗密码(准确地说是窃密码而不是盗密码,
使用动态库(更广泛地说是PE文件)中的代码,有两种办法:改写导出函数,直接指向我们需要的函数位置(以上的1000EB21明显是内部函数,这样,可以将内部函数变成外部函数),然后使用声明(VB中)或引用(VC)的方式执行。这么做有些麻烦同时也需要技巧,就是要找到合适的导出函数才好使用。另一个方法就是将PE文件加载到内存中,然后改变执行指针,指向被执行地址,执行完毕后平衡堆栈,取得需要的数据后返回。我们就使用第二种方法。
很多加密算法的破解都可以使用这种方法,这叫用其人之矛,攻其人之盾;或者叫用其人只盾,轧其人之矛。我不知道是不是我的首创,我在很久以前就在使用这种方法,并且屡战屡胜(在前面我已经劝高手们主动离开了,这里我就自吹自擂一下:)。
关于这一点,我突然有种悚然的感觉,加载到内存中的代码就象一群僵尸,我们的任务是给其中一个注入灵魂,让他活起来。
有关的注意事项我就不多说了,那些基本知识自己想办法掌握吧。
我们依然使用通俗易懂的VB来完成这个艰巨而光荣的任务,通过在VB中调用汇编代码的方式来控制程序流程,达到我们的目的。
在进一步讲解之前,先统一思想。下面是我们的思路:
加载动态库 → 找到入口指针 → 计算我们代码的偏移地址并执行 → 清理堆栈并返回数据 → 结束
为了验证程序的正确性,我们随便跟踪一个数据,其中:
密钥:
100127B8
输入明文:
0143E078 47 65 74
0143E088 36 2E 32 33 2E 32 31 39 0D
如果函数执行成功,我们会将会返回加密后的数据:
输出密文:
如果你的输出与上述数据不同,一定是你没听懂我的话啦,是不是要我Speak English你才有感觉啊?
哦,好象每次加密真的不一样啊!记得我说过吗,这是使用了随机数的结果,如果你每次加密都一样,说明你的计算机太低级了,连随机数都不会算。
上面的跟踪中,我们发现加密函数位于动态库BasicCtrlDll.dll内存偏移1000EB21的位置,因此,我们随便找一个输出函数(参看附件中的BasicCtrlDll导出表.txt),例如我们在函数输出表中找到“??0CVQQSock@@QAE@XZ”函数(找个名字短一点的),其入口地址为10008D
不过,我好讨厌那些随机数,他们的存在,使我无法研究加密的规律,因此,我们可以在程序中去掉这些随机数,用常数代替,便于我们进一步的研究(也许你会怀疑,用常数代替随机数,QQ能干么?我请你用脚后跟想想,常数包含在随机数中,属于随机数的一种特例,因此对程序的运行不会产生任何影响,让EAX=0吧,然后跳转到正常的指令。因为这样修改后代码最少并且最可靠,大家注意下面的代码,那个<&MSVCRT.rand>比较危险,程序在运行的过程中会修改这个数据的,因为这个数据是根据程序加载的情况而定的,因此使用跳转指令最安全)。
原代码:
1000EB42 8B3D AC230110 mov edi,dword ptr ds:[<&MSVCRT.rand>]
1000EB48 FFD7 call edi
修改后:
1000EB42
XXXXXXX EB 04 JMP 1000EB49
XXXXXXX 00 XXXX
XXXXXXX 00 XXXX
XXXXXXX 00 XXXX
1000EB48 00 XXXX
修改方法:用十六进制编辑器打开BasicCtrlDll.dll,寻找8B 3D AC 23 01 10 FF D7,修改成
看到效果了吧,经过我们的修改,每次加密的结果固定不变了,当改变明文时,密文变化很大(附件中有个QQEncryptTest.exe的程序,附源码,分别调用“常数加密”和“随机加密”,便可以看到这种效果)。
好了,现在,我们作个小结,我们应该掌握了一种方法,能够窥探程序的隐私并且将代码原封不动地为我所用。这种技术将用于破解许多具有各种陷阱的算法,因为我们既不跟踪又不分析,我们用最小的代价取得了最大的胜利。
有了加密函数,必然有解密函数,寻找加密函数已经让我们的脑袋大了一个Size,再去找解密函数,我们的帽子就得换大的了(换帽子的时候注意颜色哦:)。根据经验,解密函数一定也会在调用参数中加入密钥,因此,我们只要在内存中搜索100127B8就行了,搜索的结果真的令人失望,除了那个加密的地方有这个参数外,其余的地方没找到。这也可以理解,没事把解密的函数放在动态库中干吗?这个动态库只要负责加密就够了(如果你找到了千万要告诉我,反正我懒得找了,虽然没有找到,但是附件中的代码也演示了上述思想——调用BasicCtrlDll.dll的内部私有函数并且得到返回值),这里我向腾讯公司强烈呼吁,下一个版本中请放入解密函数。
不过,我们的工作没有结束,相反才开始,前期的努力已经打下坚实的基础,我们把目光集中在QQ.exe上,因为我坚信,肯定存在解密函数,东边不亮西边亮,这个函数负责将腾讯服务器传来的确认数据解密。
在上述代码中,我们看到了一个数据:
好了,我们从现在开始将注意力集中在QQ.exe里,别开小差哦:)
怎么找呢?面对这个大餐,真的不知道怎么下爪子了吧?
其实,有个特征很明显,由于我们已经知道了是用TEA的加密方法,我们根据MD5破解获得的经验,只要搜索标准的加密特征就够了。
根据我的经验,想知道是否使用了MD5加密,可以搜索十六进制56b
用跟踪调试工具或者静态反汇编工具打开QQ.exe,搜索
如果你熟悉TEA,加密的特征是“y += …”,解密的特征是“z -= …”,因此,观察汇编代码,就能看出找到的是什么了。例如,搜索特征字后,我们找到:
::00409D55:: 2D |
SUB EAX, |
TEA特征字 |
::00409D |
SHL ESI,4 |
|
::00409D5D:: |
ADD ESI,[EBP-10] |
|
::00409D60:: 33D6 |
XOR EDX,ESI |
|
::00409D62:: 8D3418 |
LEA ESI,[EAX+EBX] |
|
::00409D65:: 33D6 |
XOR EDX,ESI |
|
::00409D67:: 03FA |
ADD EDI,EDX |
|
::00409D69:: 8BD7 |
MOV EDX,EDI |
|
::00409D6B:: 8BF7 |
MOV ESI,EDI |
|
::00409D6D:: C1EA 05 |
SHR EDX,5 |
|
::00409D70:: 0355 FC |
ADD EDX,[EBP-4] |
|
::00409D73:: C1E6 04 |
SHL ESI,4 |
|
::00409D76:: |
ADD ESI,[EBP-8] |
|
::00409D79:: 33D6 |
XOR EDX,ESI |
|
::00409D7B:: 8D3438 |
LEA ESI,[EAX+EDI] |
|
::00409D7E:: 33D6 |
XOR EDX,ESI |
|
::00409D80:: 03DA |
ADD EBX,EDX |
相当于y += |
::00409D82:: 49 |
DEC ECX |
|
::00409D83:: |
JNZ SHORT 00409D4B |
|
因此,这个函数是加密函数,同样我们可以找到解密的函数,这样,我们终于把武器凑齐了。如果对上述函数下断点,我们可以跟踪到外层函数,如下:
00408DB3 |
8D45 E0 |
lea eax,dword ptr ss:[ebp-20] |
|
00408DB6 |
50 |
push eax |
密文长度 |
00408DB7 |
56 |
push esi |
加密后的密文 |
00408DB8 |
|
push QQ.004D6EC4 |
密钥 |
00408DBD |
FF75 10 |
push dword ptr ss:[ebp+10] |
明文长度 |
00408DC0 |
FF75 |
push dword ptr ss:[ebp+C] |
明文 |
00408DC3 |
E8 52130000 |
call QQ |
TEA数据加密函数 |
这个函数非常完美,因为其参数没有一个多余的,我们就用前面介绍的知识来调用这个函数吧,可以看到,这个函数的调用形式为:
call QQ
QQ.Exe也具备导出函数(参见QQ导出表.txt),很多时候,根据这些函数名称再配合人类的想象,基本可以断定函数的功能并且在我们的程序中利用这个功能。我们如法炮制,具体实现过程参考上面的内容。
值得注意的是,我们使用本方法调用动态库的时候,程序的执行基本没什么问题,而调用QQ.exe这类应用程序的时候可能会死掉,这主要是因为在加载动态库(使用函数LoadLibrary)时,动态库的初始代码已经将必要的变量包括引用的库进行了初始化(例如,BasicCtrlDll.dll中的加密函数在执行的时候,要访问WSock32.DLL,但是,我们执行的时候好象没这种感觉,该库已经加载了),因此,当执行“mov edi,dword ptr ds:[<&MSVCRT.rand>]”汇编代码(即调用随机函数Rand)时,内存已经加载了MSVCRT模块并且在数据段ds:[<&MSVCRT.rand>]处进行了填充。然而加载QQ.exe时,并没有这么做,因此,执行到同样的语句时,由于该块内存没有初始化造成代码无法访问,出现错误,解决的办法是,将所有对此处.rand的调用修改成固定的汇编语句(参考上面的说明)。
不过,这也不是办法,如果还有其他一些必须执行的代码怎么办呢?关键的问题是希望QQ.exe能够自己进行初始化,该调用的调用,该填充的填充,我们为了研究他这么辛苦,他总该自己做点什么吧。
思路就是,直接执行QQ.exe,一旦启动后,他就会主动地去做这些事情了。我们等他做得差不多的时候,再将那些感兴趣的代码拿过来为我所用。
以上,我们找到了加密函数的位置,下面的任务就是寻找解密函数了,不过没必要到处找,一般对于腾讯这种大公司,源代码的书写和管理是很讲究的,因此,在程序的编制中,往往同样的功能函数会放在一起,编译以后的代码肯定也在一起。根据这种猜测,我们只用看看这个函数的左麟右李是不是有相似的代码(一般加密和解密是对称的,用我们的肉眼就能分辨),最明显的证据是在调用时一定有五个参数。根据跳转表和调用表(建议使用C32Asm.exe工具),我们发现位于加密函数
004943CC |
8D45 |
LEA EAX,[EBP+C] |
004943CF |
50 |
PUSH EAX |
004943D0 |
56 |
PUSH ESI |
004943D1 |
FF75 10 |
PUSH DWORD PTR [EBP+10] |
004943D4 |
FF75 |
PUSH DWORD PTR [EBP+C] |
004943D7 |
FF75 08 |
PUSH DWORD PTR [EBP+8] |
004943DA |
E8 0B5FF7FF |
CALL |
我们可以写成这种调用形式:
CALL