摘要: 大数据量的问题是很多面试笔试中经常出现的问题,比如baidu google 腾讯 这样的一些涉及到海量数据的公司经常会问到。下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目,方法不一定最优,如果你有更好的处理方法,欢迎与我讨论。1.Bloom filter适用范围:可以用来实现数据字典,进行数据的判重,或者集合求交集基本原理及要点:对 于原理来说很简单,位数组+k个独立hash函数。将hash函数对应的值的位数组置1,查找时如果发现所有hash函 阅读全文
posted @ 2012-09-10 21:40 可乐爱上了雪碧 阅读(188) 评论(0) 推荐(0) 编辑
摘要: //创建进程static const size_t url_size = 1024; TCHAR url[url_size] = { 0 }; size_t size = _countof(url); Update::GetInstance()->GetUpdateUrl(url, size);TCHAR szCmdLine[2*1024] = { 0 }; _sntprintf_s(szCmdLine,_countof(szCmdLine),_countof(szCmdLine),_T(" %s"),url); STARTUPINFO si = {sizeof(si 阅读全文
posted @ 2012-09-10 21:01 可乐爱上了雪碧 阅读(483) 评论(0) 推荐(0) 编辑
摘要: //写数据,Handle不能关掉,不然就读不到了TCHAR url[1024] = {0}; size_t size = _countof(url);//Update::GetInstance()->GetUpdateUrl(url, size);赋值 HANDLE hFile = CreateFileMapping((HANDLE)-1,NULL,PAGE_READWRITE,0,size,_T("URL"));//指定一个名称 VOID * pMem = NULL; if(hFile != NULL) { //获取存储的内存地址 pMem = MapViewOfF 阅读全文
posted @ 2012-09-10 20:41 可乐爱上了雪碧 阅读(260) 评论(0) 推荐(0) 编辑