摘要: 转自: http://www.cnblogs.com/forfuture1978/p/3945755.html 好好看看吧 倒排列表信息中词典相关存储的最关键格式 占倒排列表中文件大小的多数 我们来看最复杂的部分,就是Term Dictionary和Term Index文件,Term Diction 阅读全文
posted @ 2017-03-27 15:30 bonelee 阅读(1123) 评论(0) 推荐(0) 编辑
摘要: 超线程是Intel 所研发的一种技术,于2002年发布。超线程的英文是HT技术,全名为Hyper-Threading,中文又名超线程。超线程技术原先只应用于Intel Xeon处理器中,当时称为Super-Threading。之后陆续应用在Pentium 4中,将技术主流化。 超线程是Intel 所 阅读全文
posted @ 2017-03-27 11:13 bonelee 阅读(1111) 评论(0) 推荐(0) 编辑
摘要: 转自infoQ! 根据 O’Reilly 2016年数据科学薪资调查显示,SQL 是数据科学领域使用最广泛的语言。大部分项目都需要一些SQL 操作,甚至有一些只需要SQL。 本文涵盖了6个开源领导者:Hive、Impala、Spark SQL、Drill、HAWQ 以及Presto,还加上Calci 阅读全文
posted @ 2017-03-27 10:16 bonelee 阅读(28951) 评论(0) 推荐(0) 编辑