上一页 1 ··· 243 244 245 246 247 248 249 250 251 ··· 270 下一页
摘要: 转自: http://www.infoq.com/cn/articles/hadoop-ten-years-part03 转自: http://www.infoq.com/cn/articles/hadoop-ten-years-part03 编者按:Hadoop于2006年1月28日诞生,至今已有 阅读全文
posted @ 2017-01-26 17:54 bonelee 阅读(427) 评论(0) 推荐(0) 编辑
摘要: 摘自:http://www.36dsj.com/archives/75208 最近参与了了一个日志和告警的数据挖掘项目,里面用到的一些思路在这里和大家做一个分享。 项目的需求是收集的客户系统一个月300G左右的的日志和告警数据做一个整理,主要是归类(Grouping)和关联(Correlation) 阅读全文
posted @ 2017-01-26 17:09 bonelee 阅读(7672) 评论(0) 推荐(0) 编辑
摘要: 大数据分析处理架构图 数据源: 除该种方法之外,还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构,而特别要说的是流数据,它的核心就是数据的连续性和快速分析性; 计算层: 内存计算中的Spark是UC Berkeley的最新作品,思路是利用集群中的所有内存将要处理 阅读全文
posted @ 2017-01-26 16:37 bonelee 阅读(6632) 评论(0) 推荐(0) 编辑
摘要: http://stackoverflow.com/questions/185697/the-most-efficient-way-to-find-top-k-frequent-words-in-a-big-word-sequence http://www.geeksforgeeks.org/find 阅读全文
posted @ 2017-01-26 10:06 bonelee 阅读(1233) 评论(0) 推荐(0) 编辑
摘要: [TD精选] 基于100,000篇演讲的分析数据科学家发现了最佳演讲者的特征 相信大部分人一定试图寻找过使得自己的演讲变得更加吸引人,更加有气势的方法。现如今,在大数据工具和机器学习技术的辅助下,找到完美演讲的答案已经变得十分容易。Noah Zandan, CEO of Quantified Com 阅读全文
posted @ 2017-01-25 15:28 bonelee 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 转自: 可看到它使用机器学习算法来识别DNS安全问题 http://logz.io/blog/machine-learning-log-analytics/ A Machine Learning Approach to Log Analytics By Tomer Levy| January 19t 阅读全文
posted @ 2017-01-25 15:23 bonelee 阅读(2431) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.lai18.com/content/7084969.html Facet说明 我们在浏览网站的时候,经常会遇到按某一类条件查询的情况,这种情况尤以电商网站最多,以天猫商城为例,我们选择某一个品牌,系统会将该品牌对应的商品展示出来,效果图如下:如上图,我们关注的是品牌,选购 阅读全文
posted @ 2017-01-24 15:36 bonelee 阅读(1834) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.tianyiqingci.com/2016/04/11/esaggsapi/ 前言 转自:http://www.tianyiqingci.com/2016/04/11/esaggsapi/ 前言 说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggr 阅读全文
posted @ 2017-01-24 10:21 bonelee 阅读(2175) 评论(0) 推荐(0) 编辑
摘要: WE'VE JOINED MONGODB! We're proud to announce that MongoDB has acquired WiredTiger, and we've joined the MongoDB team! We will be directly involved in 阅读全文
posted @ 2017-01-24 10:04 bonelee 阅读(781) 评论(0) 推荐(0) 编辑
摘要: 数据文件结构 Extent 在每一个数据文件内,MongoDB把所存储的BSON文档的数据和B树索引组织到逻辑容器“Extent”里面。如下图所示(my-db.1和my-db.2 是数据库的两个数据文件): 一个文件可以有多个Extent 每一个Extent只会包含一个集合的数据或者索引 同一个集合 阅读全文
posted @ 2017-01-24 09:53 bonelee 阅读(779) 评论(0) 推荐(0) 编辑
上一页 1 ··· 243 244 245 246 247 248 249 250 251 ··· 270 下一页