上一页 1 ··· 244 245 246 247 248 249 250 251 252 ··· 271 下一页
摘要: http://stackoverflow.com/questions/185697/the-most-efficient-way-to-find-top-k-frequent-words-in-a-big-word-sequence http://www.geeksforgeeks.org/find 阅读全文
posted @ 2017-01-26 10:06 bonelee 阅读(1235) 评论(0) 推荐(0) 编辑
摘要: [TD精选] 基于100,000篇演讲的分析数据科学家发现了最佳演讲者的特征 相信大部分人一定试图寻找过使得自己的演讲变得更加吸引人,更加有气势的方法。现如今,在大数据工具和机器学习技术的辅助下,找到完美演讲的答案已经变得十分容易。Noah Zandan, CEO of Quantified Com 阅读全文
posted @ 2017-01-25 15:28 bonelee 阅读(383) 评论(0) 推荐(0) 编辑
摘要: 转自: 可看到它使用机器学习算法来识别DNS安全问题 http://logz.io/blog/machine-learning-log-analytics/ A Machine Learning Approach to Log Analytics By Tomer Levy| January 19t 阅读全文
posted @ 2017-01-25 15:23 bonelee 阅读(2431) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.lai18.com/content/7084969.html Facet说明 我们在浏览网站的时候,经常会遇到按某一类条件查询的情况,这种情况尤以电商网站最多,以天猫商城为例,我们选择某一个品牌,系统会将该品牌对应的商品展示出来,效果图如下:如上图,我们关注的是品牌,选购 阅读全文
posted @ 2017-01-24 15:36 bonelee 阅读(1837) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.tianyiqingci.com/2016/04/11/esaggsapi/ 前言 转自:http://www.tianyiqingci.com/2016/04/11/esaggsapi/ 前言 说完了ES的索引与检索,接着再介绍一个ES高级功能API – 聚合(Aggr 阅读全文
posted @ 2017-01-24 10:21 bonelee 阅读(2175) 评论(0) 推荐(0) 编辑
摘要: WE'VE JOINED MONGODB! We're proud to announce that MongoDB has acquired WiredTiger, and we've joined the MongoDB team! We will be directly involved in 阅读全文
posted @ 2017-01-24 10:04 bonelee 阅读(781) 评论(0) 推荐(0) 编辑
摘要: 数据文件结构 Extent 在每一个数据文件内,MongoDB把所存储的BSON文档的数据和B树索引组织到逻辑容器“Extent”里面。如下图所示(my-db.1和my-db.2 是数据库的两个数据文件): 一个文件可以有多个Extent 每一个Extent只会包含一个集合的数据或者索引 同一个集合 阅读全文
posted @ 2017-01-24 09:53 bonelee 阅读(779) 评论(0) 推荐(0) 编辑
摘要: 转自:http://www.mongoing.com/archives/2540 传统数据库引擎的数据组织方式,一般存储引擎都是采用 btree 或者 lsm tree 来实现索引,但是索引的最小单位不是 K/V 记录对象,而是数据页,数据页的组织关系实现就是存储引擎的数据组织方式。 Mongodb 阅读全文
posted @ 2017-01-24 09:05 bonelee 阅读(1677) 评论(0) 推荐(0) 编辑
摘要: 分析 最后,我们还有一个需求需要完成:允许管理者在职员目录中进行一些分析。 Elasticsearch有一个功能叫做聚合(aggregations),它允许你在数据上生成复杂的分析统计。它很像SQL中的GROUP BY但是功能更强大。 + + 举个例子,让我们找到所有职员中最大的共同点(兴趣爱好)是 阅读全文
posted @ 2017-01-23 18:10 bonelee 阅读(9262) 评论(0) 推荐(0) 编辑
摘要: 特定字段的统计功能——取值分布,topK,min/max/平均值 例如: date_second 60 值, 100% 的事件 时段平均值 时段最大值 时段最小值 上限值 时段上限值 罕见值 具有此字段的事件 平均: 30.963998 最小值: 0 最大值: 59 标准 偏差: 17.300073 阅读全文
posted @ 2017-01-23 15:09 bonelee 阅读(2544) 评论(0) 推荐(0) 编辑
上一页 1 ··· 244 245 246 247 248 249 250 251 252 ··· 271 下一页