iwork 文件格式分析
摘要:根据维基百科,到2015年苹果推出的iwork版本 iwork2008介绍 1、文档结构: 是一个资源合集:压缩格式的(内含文件夹和文件) 在windows下修改iwork的文件后缀为.rar,解压缩后可以看到: iwork2008介绍 1、文档结构: 是一个资源合集:压缩格式的(内含文件夹和文件)
阅读全文
posted @
2016-03-22 11:58
欢跳的心
阅读(2440)
推荐(0) 编辑
MIME类型
摘要:因特网上有数千种不同的数据类型,HTTP仔细的给每种要通过WEB传输的对象都打上了名为MIME类型(MIME type)的数据格式标签。最初设计MIME(Multipurpose Internet Mail Extension,多用途因特网邮件扩展)是为了解决在不同的电子邮件系统之间搬移报文时存在的
阅读全文
posted @
2016-01-12 14:07
欢跳的心
阅读(372)
推荐(0) 编辑
linux系统下file使用的magic文件格式说明
摘要:bestring16 一个两个字节unicode(UCS16)字符串以大端字节序表示 (0x3c.l):读取从开始偏移0x3c个字节位置的long长度的值(l的含义)用该值和PE\0\0做字符串的比较,如果相等就匹配 圆括号内允许一个去修改从文件中读取的值在他被用作一个偏移量之前。 相对位置偏移0字
阅读全文
posted @
2015-07-08 10:05
欢跳的心
阅读(5781)
推荐(0) 编辑
文件解析库doctotext源码分析
摘要:doctotext中没有make install选项,make后生成可执行文件 在buile目录下面有.so动态库和头文件,需要的可以从这里面拷贝 build/doctotext就是可执行程序。 doctotext内置了两种检测文件类型方法: 1、以后缀为依据检测文件类型 2、以内容为依据检测文件类
阅读全文
posted @
2015-01-29 14:33
欢跳的心
阅读(1804)
推荐(0) 编辑
文件解析库doctotext安装和使用
摘要:安装doctotext 1 安装GCC到4.6以上 tar jxf gcc-4.7.0.tar.bz2 cd gcc-4.7.0 编译 ./contrib/download_prerequisites mkdir build cd build ../configure --disable-check
阅读全文
posted @
2015-01-29 14:30
欢跳的心
阅读(1485)
推荐(0) 编辑
c/c++语言实现tesseract ocr引擎编程实例
摘要:这个是个实现tesseract OCR引擎编程的C++程序和C程序的小例子
阅读全文
posted @
2015-01-15 09:16
欢跳的心
阅读(5956)
推荐(0) 编辑