[转载]swf文件格式解析(二)

http://blog.sina.com.cn/s/blog_6a2061a20100ye5d.html
 
 
 
 
 

上一篇教程可能写的有点乱 ,本回合开始之前先做一个概述吧,引用官方白皮书的原文

概述

SWF 文件是由一个文件头,和跟在后面的一系列的标签组成。标签有定义型标签和控

制型标签两类。定义型标签把对象定义为角色存储在字典里,控制型标签操作这些角色并控

制影片的流程。

如下图

[转载]swf文件格式解析(二)

上回合已经解析完文件头 本会合接着解析Tag

首先,官方理论知识补充

定义型标签和控制型标签

Swf 文件有两类标签:定义型和控制型

A定义型标签定义SWF 文件的内容如Shapes、文本、位图、声音等等。每一个标签会为

定义的内容分配一个唯一的编号称做角色编号(character ID)。之后Flash Player 将角色

character)存储在称作字典(dictionary)的仓库。定义型标签本身不产生渲染。

B控制型标签创建和操作已渲染的字典中角色的实例,同时控制文件流程。

 

SWF文件的处理过程

Flash Player 会处理所有的标签直到遇到ShowFrame 标签。此时,显示列表被复制到屏

幕,然后播放器继续处理直到下一帧需要显示。第一帧的内容累计了第一个ShowFrame 标

签之前所有控制型标签的执行结果,第二帧的内容累计从文件开始到第二个ShowFrame 标

签的所有控制标签的执行效果,以此类推。

 

长标签和短标签

Tag分为长标签跟短标签

这个有一个官方的介绍

每一个标签的开始都是标签的类型和长度。标签头可以是短标签头类型也可以是长标签

头类型。短标签头类型用于数据在62 字节之内的标签。如果标签的数据长度不超过62 个字

节使用短标签。而长标签头类型可以用于数据在4G 之内的任何标签。

 

标签头记录(短类型)

字段

类型

说明

TagCodeAndLength

UI16(两个字节)

10 位表示标签类型

6 位表示标签长度

 

注意事项:

TagCodeAndLength 字段是一个两个字节的字,而不是一个10 位的字段跟随一个6

位字段。SWF 使用低位在前(little-endian)造成上述两种情况是不同的。

(ps:如果TagCodeAndLength 字段的十六进制是44 11 那么实际上的值是11 44 二

进制为00010001 01000100前10 位的值是69 表示这是一个FileAttributes标

签)

标签的长度不包括标签头记录自己的长度,仅表示其后面数据的长度。

长标签

标签头记录(长类型)

字段

类型

说明

TagCodeAndLength

UI16(两个字节)

10 位表示标签类型

6 位始终为0x3F即111111

Length

SI32

标签的长度

在开始解析之前,我引用一下swf_file_format_spec_v10白皮书中关于标签字段数值跟类型的对应表

 

Tag value Tag name

0 End

1 ShowFrame

2 DefineShape

4 PlaceObject

5 RemoveObject

6 DefineBits

7 DefineButton

8 JPEGTables

9 SetBackgroundColor

10 DefineFont

11 DefineText

12 DoAction

13 DefineFontInfo

14 DefineSound

15 StartSound

17 DefineButtonSound

18 SoundStreamHead

19 SoundStreamBlock

20 DefineBitsLossless

21 DefineBitsJPEG2

22 DefineShape2

23 DefineButtonCxform

24 Protect

26 PlaceObject2

28 RemoveObject2

32 DefineShape3

33 DefineText2

34 DefineButton2

35 DefineBitsJPEG3

36 DefineBitsLossless2

37 DefineEditText

39 DefineSprite

43 FrameLabel

45 SoundStreamHead2

46 DefineMorphShape

48 DefineFont2

56 ExportAssets

57 ImportAssets

58 EnableDebugger

59 DoInitAction

60 DefineVideoStream

61 VideoFrame

62 DefineFontInfo2

64 EnableDebugger2

65 ScriptLimits

66 SetTabIndex

69 FileAttributes

70 PlaceObject3

71 ImportAssets2

73 DefineFontAlignZones

74 CSMTextSettings

75 DefineFont3

76 SymbolClass

77 Metadata

78 DefineScalingGrid

82 DoABC

83 DefineShape4

84 DefineMorphShape2

86 DefineSceneAndFrameLabelData

87 DefineBinaryData

88 DefineFontName

89 StartSound2

90 DefineBitsJPEG4

91 DefineFont4

 

 

 

下边继续分析我们上一回合那个swf

重新用Hex workshop打开,截一张图

[转载]swf文件格式解析(二)

 

第一个标签:
记录头部 44 11 =11 44 =0001000101 000100
因为 000100!= 111111 所以是短格式, 而且这个标签的长度为 4 ,标签的类型为 69 为FileAttributes(文件属性),(貌似是从swf6之后第一个标签都是这个FileAttributes)

内容是19 00 00 00

 

继续分析下第二个标签,这是一个长标签,注意跟短标签有什么不同
记录头部 7f 13 =13 7f =0001001101 111111
因为 111111 所以是长格式, 取后四位(因为length为SI32)CB 01 00 00(作为这个标签的长度 0x000001CB = 459 ,标签的类型为 77
属性是 Metadata 内容为后边459个字节

.

.

.直到最后的结束标签

记录头部:00 00 = 00 00 = 0000000000 000000
短标签:标签长度为0,标签类型为0
标签属性:End
标签头 加 内容(内容为空)为 :00 00

下边的标签就不一一赘述,按照这种方式都可以一一解析完毕

其中最重要的一个标签为82 DoABC(Actionscript ByteCode)标签 即AVM2中执行as代码的地方,这个TAG解析是一件非常浩大的工程,很多前辈都放弃了,如果我有生之年有遗力,一定单独解析一下,以了却那么多前辈的心愿

 

对应上边的表格 我们可以查到SymbolClass对应的编号为76,我们想得到swf中的链接类其实就是重点解析SymbolClass这个Tag的

 

下边理论上分析一下SymbolClass

 

先看以下官方白皮书介绍

SymbolClass

The SymbolClass tag creates associations between symbols in the SWF file and

ActionScript 3.0 classes. It is the ActionScript 3.0 equivalent of the ExportAssets tag. If the

character ID is zero, the class is associated with the main timeline of the SWF. This is how the root class of a SWF is designated. Classes listed in the SymbolClass tag are available for

creation by other SWF files (see StartSound2DefineEditText (HasFontClass), and

PlaceObject3 (PlaceFlagHasClassName and PlaceFlagHasImage). For example, ten SWF files that are all part of the same website can share an embedded custom font if one file embeds and exports the font class.

 

这个无非就是介绍了导出类的概念 以及导出类可以被其他swf调用等等,这个都不难理解

之后就是ADOBE 坑爹的一段,为了澄清我对他的污蔑,我把它的白皮书直接截图下来

[转载]swf文件格式解析(二)

上边是解释symbolclass的一个表格 意思就是

这个tag的组成部分由 header(即symbolclass这标签)+NumSymbols(这个标签导出类的数量占两个字节)+类一ID+类一名字(字符串格式)…类N ID+ 类N名字。

于是 我就按照这个形式一个字节一个字节解析,结果解析了半下午啊

尼玛我这看来看去啊!!

白皮书很值得信任有木有啊!!

哥一个字一个字翻译有木有啊!!!

英文不好的程序员伤不起啊!!

 

到后来,还是用Hex workshop 一个字节一个字节自己的看16进制

 

上截图

 

[转载]swf文件格式解析(二)

 

 

 

两个类之间跟不仅仅是一个两个字节的Tag ID

尼玛明明有三个字节啊!!!!!!

 

好了,咆哮之后淡定,我这理解就就是adobe白皮书的一个错误,据过来人说白皮书中有三四处错误,

如果是我冤枉ADOBE了,谁给我指正 在下同样感激涕零…..

 

 

以下是用AS3写的一个对SymbolClass解析,包括之前文件头的解释 源码如下

 

package symbolClass
{   
	import flash.display.Sprite;
	import flash.utils.ByteArray;
	import flash.utils.Endian;
	import flashx.textLayout.elements.InlineGraphicElement;

	public class ByteArrayTest extends Sprite
	{   
		[Embed(source = "mainCity.swf", mimeType="application/octet-stream")]
		private var TestSwf:Class;  
		private var _swfByteArray:ByteArray = new ByteArray; 
		private const COMPRESSED:String = "CWS"; 
		private var _swfSize:int; 
		private var _frameRate:int; 
		private var _frameTotal:int; 
		private var _version:int; 
		private var TestClass:Class
			public function ByteArrayTest()
		{       
			super();     
			var tempByteArray:ByteArray = new TestSwf();

			//是否 压缩  
			var compressed:String = tempByteArray.readUTFBytes(3);

			//swf 版本
			_version = tempByteArray.readByte();
			//
			var length:uint = tempByteArray.readUnsignedInt();   

			tempByteArray.position = 8; 

			tempByteArray.readBytes(_swfByteArray); 

			if(compressed == COMPRESSED)
			{
				_swfByteArray.uncompress(); 
			}  
			_swfByteArray.endian = Endian.LITTLE_ENDIAN;

			// 解析 swf 宽度 高度 数据 rect 数据
			_swfSize = _swfByteArray.readUnsignedByte()>>3;
			_swfByteArray.position = Math.ceil((_swfSize*4)/8+5);// 计算 rect 结束位置
			trace(_swfByteArray.position); 
			_frameRate = _swfByteArray.readShort()/256;//读取帧频 因为低8位是小数,所以需要除以2的8次方
			_frameTotal = _swfByteArray.readShort();//读取 总帧数
			trace("compressed:",compressed,"swf_version:",_version,"frameRate:",_frameRate,"frameTotal:",_frameTotal);
			parseTagType();   
		} 

		private function parseTagType():void
		{     
			//设置读取数据的字节顺序为倒序(以字节为单位)
			_swfByteArray.endian = Endian.LITTLE_ENDIAN; 
			while(_swfByteArray.bytesAvailable)
			{
				var tagHead:int = _swfByteArray.readShort();
				var tagType:int = tagHead>>6;

				//0x3F  00111111
				var tagLength:int = tagHead & 0x3F;   
				if(tagLength == 63) //如果tag 是长类型
				{
					tagLength = _swfByteArray.readUnsignedInt();
				}

				// 解析 symbolClass tag
				if(tagType == 76) 
				{   
					parseSymbolClass(tagLength); 
				}
				else
				{
					_swfByteArray.position += tagLength;
				}
			}
		}  

		private var _classList:Array; 
		private function parseSymbolClass(length:int):void
		{
			_classList = [];
			var classNum:int = _swfByteArray.readShort();
			while(classNum --)
			{   
				var classId:int = _swfByteArray.readUnsignedShort();
				// trace("classId之后的位置是"+_swfByteArray.position);
				var char:int = _swfByteArray.readByte(); 

				var name:String = "";

				while(char)
				{    
					name += String.fromCharCode(char);    
					char = _swfByteArray.readByte(); 
				}
				trace("导出类名为"+name);
				_classList.push(name);
			} 
		} 
	}
} 

  

上边那个例子嵌入了我自己的一个swf 大家可以换下自己的进行实验,会依次输出swf的类名 如下图

[转载]swf文件格式解析(二)

至于如何用这些东西开发相应的工具,不属于本文范畴

关于ByteArray的一些用法,也请各位自行查看API

 

本回合结束!!至于DoABC的详细解析....等我鼓足勇气再来吧.....

 posted on 2015-10-30 09:46  BlueAndGray  阅读(400)  评论(0编辑  收藏  举报