随笔分类 -  算法

复合文档的二进制存储格式研究[ole存储结构](word,xls,ppt...)[转]
摘要:复合文档文件格式研究前 言复合文档(Compound Document) 是一种不仅包含文本而且包括图形、电子表格数据、声音、视频图象以及其它信息的文档。可以把复合文档想象成一个所有者,它装着文本、图形以及多媒体信息如 声音和图象。目前建立复合文档的趋势是使用面向对象技术,在这里,非标准信息如图像和... 阅读全文
posted @ 2014-06-26 21:03 极简 阅读(3963) 评论(2) 推荐(1) 编辑
C# 加密算法[汇总]
摘要:【散列类型】 不可逆,严格说不算加密算法,是一种保证数据完整性的算法或数字签名.MD5 1 public static string EnMd5(string str) 2 { 3 string pwd = ""; 4 MD5 md5 = MD5.Create(); 5 //注意编码UTF8/Unicode 6 byte[] s = md5.ComputeHash(Encoding.UTF8.GetBytes(str)); 7 for (int i = 0; i < s.Length; i++) 8 { 9 pwd = ... 阅读全文
posted @ 2012-12-02 17:19 极简 阅读(914) 评论(0) 推荐(0) 编辑
C# 图片操作 常用方法 总结
摘要:Image To byte[]1 //image to byte[]2 static byte[] Image2Bytes(System.Drawing.Image photo)3 {4 //System.Drawing.Image photo = new System.Drawing.Bitmap(path);5 System.IO.MemoryStream ms = new System.IO.MemoryStream();6 photo.Save(ms, System.Drawin... 阅读全文
posted @ 2012-11-16 21:34 极简 阅读(620) 评论(0) 推荐(0) 编辑
大数据量处理模式
摘要:【数据库】建视图、建索引来优化查询用分页查询的存储过程游标。。。 异步? 【Ajax大数据量处理(分页思维)】思路如下: 将大数据量数据进行分割返回,例如需要返回100条数据,我们可以通过10次请求来进行返回数据。每次返回数据的时候其中包括数量的总行数、返回当前数据的位置、此次返回数据的数量。例如:{TotalRowsCount:100,CurrentRowsIndex:60,CurrentRowsCount:10}。代表总行数:100,当前行数已经返回到:60,此次返回数量10。【程序代码】【算法方案】A.分布式处理 mapreduce适用范围:数据量大,但是数据种类小可以放入内存基本原.. 阅读全文
posted @ 2012-11-11 20:32 极简 阅读(238) 评论(0) 推荐(0) 编辑
大数据量 处理方法总结(转)
摘要:1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果发现所有hash函数对应位都是1说明存在,很明显这个过程并不保证查找的结果是100%正确的。同时也不支持删除一个已经插入的关键字,因为该关键字对应的位会牵动到其他的关键字。所以一个简单的改进就是 counting Bloom filter,用一个counter数组代替位数组,就可以支持删除了。还有一个比较重要的问题,如何根据输入元素个数n,确定位数组m的大小及hash函数个数。当hash函数个数 阅读全文
posted @ 2012-11-11 20:31 极简 阅读(360) 评论(0) 推荐(0) 编辑
iTextSharp 使用详解(转)
摘要:PDF文件是目前比较流行的电子文档格式,在办公自动化(OA)等软件的开发中,经常要用到该格式,但介绍如何制作PDF格式文件的资料非常少,在网上搜来搜去,都转贴的是同一段“暴力”破解的方法,代码片断如下: StreamWriter pPDF=new StreamWriter(filePath); ArrayList xRefs=new ArrayList(); float yPos =0f; long streamStart=0; long streamEnd=0; long streamLen =0; string strPDFMessage=null; //PDF文档头信息 strPDFMe 阅读全文
posted @ 2012-11-11 20:25 极简 阅读(518) 评论(0) 推荐(0) 编辑
字符集(Character set)
摘要:字符编码:是指将计算机的二进制编码与某个抽象字符集合一一对应的规则.常见字符集名称:ASCII字符集(7bit)、GB2312字符集(2B)、BIG5字符集(2B)、GB18030字符集(4B)、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。[GB2312 字符集]内容: GB2312收录简化汉字及一般符号、序号、数字、拉丁字母、日文假名、希腊字母、俄文字母、汉语拼音符号、汉语注音字母,共 7445 个图形字符。其中包括6763个汉字,其中一级汉字3755个,二级汉字3008个;包括拉丁字母、希腊字母、日文平假名及片假名字母、俄语 阅读全文
posted @ 2012-11-11 17:03 极简 阅读(560) 评论(0) 推荐(0) 编辑
QQwry.dat 数据结构 存储结构 解析[C#代码]
摘要:存储格式: A.文件头(大小8字节), B.记录区(不定长),C.索引区(大小由文件头决定)A.文件头是8个字节长度,前四个字节存储了第一条索引的绝对地址, 后四个字节存储了最后一条索引的绝对地址。 (2^32字节=4GB)B.记录的格式是[IP地址][国家记录][地区记录]: ip:4字节, 国家记录(字符串,0结尾), 地区记录(字符串,0结尾) [字段形式] 国家名或者地区名,我们就有了两个可能: 第一就是直接的字符串表示的国家名, 第二就是一个4字节的结构, 第一个字节表明了重定向的模式, 后面3个字节是国家名或者地区名的实际偏移位置(指针)。 [重定向的模式]有两种:0x01、0.. 阅读全文
posted @ 2012-11-11 13:10 极简 阅读(961) 评论(0) 推荐(0) 编辑
使用HTML Help Workshop将HTML转为CHM
摘要:使用HTML Help Workshop编译成CHM文件需要如下三个文件,分别以hhp,hhc,hhk为文件后缀名。hhp:CHM工程文件,CHM目标文件属性参数在这里配置.hhc,列表文件,确定目标文件中左侧树形列表中"目录"选项卡下的内容.hhk,索引文件,确定目标文件中左侧树形列表中"索引"选项卡下的内容.[hhp文件]hhp几乎就是一个标准的ini文件.分为三个小节Option,Windows,Files.典型的配置文件(hhp)结构如下:test.hhp[OPTIONS]Compatibility=1.1 Or laterDefault win 阅读全文
posted @ 2012-11-11 13:09 极简 阅读(1679) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示