【转】excel文件格式分析

excel文件由下面格式组成

image

文件头由512字节组成

image

image 是管理扇区用得目录,头文件中有109个目录,如果数目大于109个目录,那么就要用

image 指向第二张目录表,一个目录表是512字节(一个扇区)能放128个目录,如果还不够,

那么该目录得最后一项指向第三张目录表,依次类推。-2代表目录表结束。就向一本书一样,每正文页代表一个扇区

那么需要一个目录表管理其中内容,头文件中已经包含最多109个目录了,不够那就要再加一页目录表,它可以放在正文

页中,只要知道它-2代表目录表结束。

image .....image ,可能还有更多得得指针,

每个指针都指出一个扇区地址,而这地址包含512个字节,包含128个项目,指出每个扇区用途

image

其他数字代表一个指针链接,他得内容是个地址,指向下个扇区,依次类推,这样可以清楚得知道n个扇区做什么用途,是做目录表,还是写数据用,就像书中正文页一样,我知道每页得用途,但我不知道书中每页内容是什么从那里来?

那么

image 指出了那个扇区存放目录,这里目录是指excel中得对象,如worksheet,compobj,vb_project等,目录结构如下

image

每个目录占用128字节,一个扇区能放四个目录。要知道所有目录,那么就要查找扇区链接,也就是知道

image 该扇区用途后,找出他得后继。

对每目录,都有image 能找出他得后继,如果image 《4096那么存放在短流中

根目录永远存放在长流中。

image

是指出该对象得性质;

如果是短流image 指出短流存放得扇区地址,同样可以得到他得后继。短流是64字节为单位

posted @ 2012-01-06 10:49  完美视界  阅读(768)  评论(0编辑  收藏  举报