摘要:
波士顿咨询公司(Boston Consulting Group)最近的一项调查显示,公司拥有的大数据能力与他们渴望在三年内拥有的大数据能力之间存在着巨大的差距。 其中一项能力——优先级能力——的不足影响尤甚,因为它是成功的根本。 此外,另外一个明显的现象是,企业选择大数据方案时非常地“随性”。有时候 阅读全文
摘要:
声明 本专栏为我的个人技术专栏,所有观点均为个人观点。如欲转载,请注明出处。 大数据平台通过将所有数据整合起来,充分分析与挖掘数据的内在价值,为业务部门提供数据平台,数据产品与数据服务。大数据平台接入的数据中可能包括很多用户的隐私和敏感信息,如用户在酒店的入住纪录,用户支付信息等,这些数据存在可能泄 阅读全文
摘要:
Apache Beam(原名Google DataFlow)是Google在2016年2月份贡献给Apache基金会的Apache孵化项目,被认为是继MapReduce,GFS和BigQuery等之后,Google在大数据处理领域对开源社区的又一个非常大的贡献。Apache Beam的主要目标是统一 阅读全文
摘要:
写在前面 近日恰逢学生临近毕业,课程后期大家“期待+苦逼”的时刻莫过于每天早上内容回顾和面试题问答部分【临近毕业每天课前用40 60分钟对之前内容回顾、提问和补充,专挑班里不爱说话就的同学回答】。 期待的是可以检验自己学习的成功;苦逼的是怎么又有东西没记住,但我们依然每天坚持一遍、一遍又一遍指导记住 阅读全文
摘要:
``` import time import random import pickle import os class Card(object): def __init__(self, cardId, cardPasswd, cardMoney): self.cardId = cardId self 阅读全文
摘要:
直接上源码 阅读全文
摘要:
小编本人目前就是在电脑面前工作,常常会工作到凌晨两三点还在为自己的梦想奋斗着。有时在办公椅上就稀里糊涂睡着了,我相信有很多朋友和我一样,这样是很不好的。第一对身体不好,第二对电脑不好。 对身体方面,小编也只能说大家年轻的时候千万要对自己好点,特别是在电 阅读全文
摘要:
认识爬虫 网络爬虫,如果互联网是一张蜘蛛网,网络爬虫既是一个在此网上爬行的蜘蛛,爬了多少路程即获取到多少数据。 python写爬虫的优势 其实以上功能很多语言和工具都能做,但是用python爬取的速度更快,代码最简单,总而言之就是高效!与其它的编程语言 阅读全文