05 2016 档案

摘要:把数据库中的数据制作成Excel数据如果我们在使用Excel的时候,需要把数据库中的数据制作成Excel数据透视表,我们该怎么操作呢?如果数据在数据库中,我们不用把数据导入到工作表中,我们可以直接以数据库的全部数据或者部分数据制作数据透视表,而且不用打开数据库文件。这些数据库可以是任何一种已知... 阅读全文
posted @ 2016-05-31 16:02 刘小子 阅读(218) 评论(0) 推荐(0) 编辑
摘要:把数据库中的数据制作成Excel数据如果我们在使用Excel的时候,需要把数据库中的数据制作成Excel数据透视表,我们该怎么操作呢?如果数据在数据库中,我们不用把数据导入到工作表中,我们可以直接以数据库的全部数据或者部分数据制作数据透视表,而且不用打开数据库文件。这些数据库可以是任何一种已知... 阅读全文
posted @ 2016-05-31 16:02 刘小子 阅读(474) 评论(0) 推荐(0) 编辑
摘要:大数据应用:引领数据浪潮创新商业价值“大数据,用起来。”中国商业联合会数据分析专业委员会会长邹东生在论坛上开门见山亮出自己的观点——“数据是一个工具,只有用起来才能发挥其神奇功效。”邹东生认为,这一工具的核心魅力所在便是数据分析。美国百货商店之父,约翰·华纳梅克曾经无奈地感叹:“我在广告上的投... 阅读全文
posted @ 2016-05-30 16:35 刘小子 阅读(134) 评论(0) 推荐(0) 编辑
摘要:这些年,这些挖掘机算法,这些反思写这篇文章,缘自于前几天部门内部成员们进行了一次部门内部现有涉及的一些算法的review以及整理。不过比较囧的就是,由于boss不在,我们讨论讨论着就成了吐槽大会,倒是有一半时间在吐槽产品以及业务部门了~~不过这也算是一件可喜可贺的事情了,这也可以看做是我们数据... 阅读全文
posted @ 2016-05-29 21:30 刘小子 阅读(150) 评论(0) 推荐(0) 编辑
摘要:数据挖掘有哪些工作流程?数据挖掘工作流程:一、收集数据收集数据一般是补充外部数据,包括采用爬虫和接口,获取,补充目前数据不足部分。Pythonscrapy,requests是很好的工具。二、准备数据主要包括数据清洗,预处理,错值纠正,缺失值填补。连续值离散化,去掉异常值,以及数据归一化的过程。... 阅读全文
posted @ 2016-05-28 17:30 刘小子 阅读(647) 评论(0) 推荐(0) 编辑
摘要:企业数据分析的架构和方法企业在正常运营中会产生数据,而对这些数据的深层次挖掘所产生的数据分析报告,对企业的运营及策略调整至关重要。对企业数据做好分析,对于促进企业的发展、为企业领导者提供决策依据有着重大作用。那么怎么做企业数据分析呢?小编带大家一起学习企业数据分析的架构和方法,希望能给大家一些... 阅读全文
posted @ 2016-05-27 16:31 刘小子 阅读(305) 评论(0) 推荐(0) 编辑
摘要:从另一个视角看大数据大数据之所以在我国引起如此大的关注,也是由于在传统文化理念中,“大概齐、差不多”的习惯深入人心,在公共决策、商业选择、个人行为中充斥着“拍脑袋”现象。 大数据是当下最时髦的话题之一,依照迈尔·舍恩伯格及库克在《大数据时代》的描述,数据被定义为不用随机分析法(抽样调查)而运... 阅读全文
posted @ 2016-05-26 15:19 刘小子 阅读(94) 评论(0) 推荐(0) 编辑
摘要:数据分析师知识结构七大拿作为数据分析师,无论最初的职业定位方向是技术还是业务,最终发到一定阶段后都会承担数据管理的角色。因此,一个具有较高层次的数据分析师需要具备完整的知识结构。1. 数据采集了解数据采集的意义在于真正了解数据的原始面貌,包括数据产生的时间、条件、格式、内容、长度、限制条件等。... 阅读全文
posted @ 2016-05-25 17:25 刘小子 阅读(153) 评论(0) 推荐(0) 编辑
摘要:数据分析师应该进什么样的公司?数据分析师这个职业现在越来越火爆。本文面向那些准备投身于这个行当的年轻人,在选择怎样的公司上给出了三条参考标准。它们分别是:第一点:去供职于那些利用数据分析来做市场战略定位的公司;第二点:去为一个拥有着伟大想法的公司工作;第三点,去选择给一家即将进入空白市场的公司... 阅读全文
posted @ 2016-05-24 14:38 刘小子 阅读(736) 评论(0) 推荐(0) 编辑
摘要:分析四类数据仓库建模方法数据库及数据仓库建模方法主要分为以下四类。第一类是关系数据库的三范式建模通常我们将三范式建模方法用于建立各种操作型数据库系统。第二类是Inmon提倡的三范式数据仓库建模它和操作型数据库系统的三范式建模在侧重点上有些不同。Inmon的数据仓库建模方法分为三层,第一层是实体... 阅读全文
posted @ 2016-05-23 13:46 刘小子 阅读(297) 评论(0) 推荐(0) 编辑
摘要:云计算存储会拖累大数据分析有鉴于云计算大数据分析对网络、存储以及服务器的严格要求,我们毫不奇怪有些客户会把麻烦的任务、花费较大的任务都外包给云计算。虽然云计算供应商们表示,他们欢迎这个新的业务机遇,支持云计算大数据分析可以迫使他们面对可管理的不同架构困难。根据几位云计算供应商的说法,云计算的弹... 阅读全文
posted @ 2016-05-22 11:24 刘小子 阅读(108) 评论(0) 推荐(0) 编辑
摘要:大数据,不仅仅是大而已很久前就想写一篇关于大数据的文章,但总是因为觉得自己功力不够所以迟迟不敢动笔。再到后来发现大数据的概念已经烂大街了,现在只要是个做产品的,收了点用户数据,就敢把自己叫大数据,似乎不这么说的产品都是非主流了。我也不想老生常谈的讲数据到底要多大才能称得上大数据,因为这似乎只是... 阅读全文
posted @ 2016-05-20 16:16 刘小子 阅读(169) 评论(0) 推荐(0) 编辑
摘要:spss中如何处理极端值、错误值spss中录入数据以后,第一步不是去分析数据,而是要检验数据是不是有录入错误的,是不是有不合常理的数据,今天我们要做一个描述性统计,进而查看哪些数据是不合理的。下面是具体的步骤:工具/原料 spss20.0方法/步骤 1 先准备好数据,然后打开描述... 阅读全文
posted @ 2016-05-19 14:27 刘小子 阅读(3169) 评论(0) 推荐(0) 编辑
摘要:大数据是开启环统数据应用的“金钥匙”环境统计是我国国民经济和社会发展统计的重要组成部分,在综合反映环境状况、服务环境管理和科学决策方面发挥了重要的基础性作用。经过多年的发展和积累,当前环境统计数据库已经具备了使用大数据库技术分析运用的基础条件。如何进一步提高环保服务事业供给动力、助推供给侧结构... 阅读全文
posted @ 2016-05-18 15:56 刘小子 阅读(335) 评论(0) 推荐(0) 编辑
摘要:Excel公式的常见错误值及其解决方法经常用Excel的朋友可能都会遇到一些莫名奇妙的错误值信息:#N/A!、#VALUE!、#DIV/O!等等,出现这些错误的原因有很多种,如果公式不能计算正确结果,Excel将显示一个错误值,例如,在需要数字的公式中使用文本、删除了被公式引用的单元格,或者使... 阅读全文
posted @ 2016-05-17 14:17 刘小子 阅读(1235) 评论(0) 推荐(0) 编辑
摘要:一个数据仓库转型者眼中的数据挖掘对于大多数非从业者或者初学者来说,数据仓库(Data Warehousing)与数据挖掘(DataMining)是很容易混淆的两个概念。有个形象的比喻说:如果把数据仓库比做一个大型的矿坑,那么数据挖掘就是入坑采矿的工作,数据挖掘需要有非常好的数据基础,没有丰富完... 阅读全文
posted @ 2016-05-16 17:40 刘小子 阅读(189) 评论(0) 推荐(0) 编辑
摘要:大数据时代特有商业模式—用户画像站在21世纪互联网时代的风口浪尖,充分感受到了大数据的浪潮扑面而来。目前市面上的大数据产品类型的框架基本上可以分为三类,包括大数据应用层产品,大数据管理层产品,大数据技术层产品。而随着商业时代数据量的剧增和用户信息的透明化和公开化。精准营销被日益聚焦放大,谁能准... 阅读全文
posted @ 2016-05-16 17:38 刘小子 阅读(602) 评论(0) 推荐(0) 编辑
摘要:十问大数据安全分析(大数据安全的小船怎样才能不翻?)人类的生产生活每天都在产生大量的数据,并且产生的速度越来越快。新的攻击手段层出不穷,需要检测的数据越来越多,现有的分析技术不堪重负。安全数据的数量、速度、种类的迅速膨胀,导致的不仅仅是海量异构数据的融合、存储和管理的问题,甚至动摇了传统的安全... 阅读全文
posted @ 2016-05-14 15:16 刘小子 阅读(228) 评论(0) 推荐(0) 编辑
摘要:数据科学家人才危机现象,是FOMO还是Silver?数据科学家的人才短缺和薪水高涨已经达到了顶板,未来还会持续下去吗?在过去几年中,高级分析(#大数据#分析)空间一直经历着严重的FOMO(害怕错过)。(译者住:FOMO(Fear of MissingOut)出自《人类行为计算》,意思为害怕错过... 阅读全文
posted @ 2016-05-13 16:03 刘小子 阅读(237) 评论(0) 推荐(0) 编辑
摘要:数据科学家也良莠不齐蹩脚数据科学家的10个迹象1.优秀的数学家可以成为顶尖的数据科学家,但光是会在笔记本上写公式可不行,他们还必须熟练地运用计算机来处理数据。2.如果他们的所有经验都来自学术机构,当他们面对现实问题时,可能会束手无策。寻找有实践经验的人,不要在这方面妥协。3.对数据科学的热情以... 阅读全文
posted @ 2016-05-12 16:09 刘小子 阅读(259) 评论(0) 推荐(0) 编辑
摘要:数据科学家也良莠不齐蹩脚数据科学家的10个迹象1.优秀的数学家可以成为顶尖的数据科学家,但光是会在笔记本上写公式可不行,他们还必须熟练地运用计算机来处理数据。2.如果他们的所有经验都来自学术机构,当他们面对现实问题时,可能会束手无策。寻找有实践经验的人,不要在这方面妥协。3.对数据科学的热情以... 阅读全文
posted @ 2016-05-12 16:09 刘小子 阅读(153) 评论(0) 推荐(0) 编辑
摘要:四种方法恢复损坏的Excel文档打开一个以前编辑好的Excel工作簿,却发现内容混乱,无法继续进行编辑,而且还不能够进行打印。这是很多朋友在处理Excel文件时都可能会遇到的一个问题,面对这种情况时,我们应该怎么办呢?出现上述情况的原因应该是该文件已经被损坏了,此时你不妨尝试使用一下笔者为大家... 阅读全文
posted @ 2016-05-10 14:48 刘小子 阅读(193) 评论(0) 推荐(0) 编辑
摘要:四种方法恢复损坏的Excel文档打开一个以前编辑好的Excel工作簿,却发现内容混乱,无法继续进行编辑,而且还不能够进行打印。这是很多朋友在处理Excel文件时都可能会遇到的一个问题,面对这种情况时,我们应该怎么办呢?出现上述情况的原因应该是该文件已经被损坏了,此时你不妨尝试使用一下笔者为大家... 阅读全文
posted @ 2016-05-10 14:48 刘小子 阅读(2510) 评论(0) 推荐(0) 编辑
摘要:大数据究竟能干什么,值得我们好好思考当我们对商业上开创性的业务还知之甚少的时候,数据基础设施的建设是快速稳定实施的。公司这么小,每个人都是一个决策循环。数据团队,也就是我,可以有自己的衡量标准和方法。但当5年后Airbnb达到43000%的增长之后,事情变的有点复杂。我们利用数据的方式更加复杂... 阅读全文
posted @ 2016-05-09 15:53 刘小子 阅读(144) 评论(0) 推荐(0) 编辑
摘要:大数据究竟能干什么,值得我们好好思考当我们对商业上开创性的业务还知之甚少的时候,数据基础设施的建设是快速稳定实施的。公司这么小,每个人都是一个决策循环。数据团队,也就是我,可以有自己的衡量标准和方法。但当5年后Airbnb达到43000%的增长之后,事情变的有点复杂。我们利用数据的方式更加复杂... 阅读全文
posted @ 2016-05-09 15:53 刘小子 阅读(116) 评论(0) 推荐(0) 编辑
摘要:大数据入门的四个必备常识一、大数据分析的五个基本方面1,可视化分析大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。2,数据挖掘算法大数据... 阅读全文
posted @ 2016-05-09 15:51 刘小子 阅读(174) 评论(0) 推荐(0) 编辑
摘要:大数据入门的四个必备常识一、大数据分析的五个基本方面1,可视化分析大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能够直观的呈现大数据特点,同时能够非常容易被读者所接受,就如同看图说话一样简单明了。2,数据挖掘算法大数据... 阅读全文
posted @ 2016-05-09 15:51 刘小子 阅读(133) 评论(0) 推荐(0) 编辑
摘要:2016年大数据的8个预测近期我一直在盯着自己的水晶球以预测大数据在明年将走向何方。正如所有的预测一样,我们必须要多加小心,因为并不是所有的预测都能变成真的。当然,一些真正改变游戏规则的创新往往并不在人们的视野内,就连警惕性极高的预言家们也会对它们的突然出现感到震惊。如果明年出现一些彻底改变我... 阅读全文
posted @ 2016-05-08 11:00 刘小子 阅读(98) 评论(0) 推荐(0) 编辑
摘要:2016年大数据的8个预测近期我一直在盯着自己的水晶球以预测大数据在明年将走向何方。正如所有的预测一样,我们必须要多加小心,因为并不是所有的预测都能变成真的。当然,一些真正改变游戏规则的创新往往并不在人们的视野内,就连警惕性极高的预言家们也会对它们的突然出现感到震惊。如果明年出现一些彻底改变我... 阅读全文
posted @ 2016-05-08 11:00 刘小子 阅读(135) 评论(0) 推荐(0) 编辑
摘要:大数据和云计算究竟有什么关系?周围总是充斥着大数据和云计算这两个词,然而,实际上,很多人对于云计算和大数据的关系却总是容易混淆,所以总是将“云计算”和“大数据”放在一起讨论,实则不然。简单来说:云计算是硬件资源的虚拟化,而大数据是海量数据的高效处理。虽然从这个解释来看也不是完全贴切,但是却可以... 阅读全文
posted @ 2016-05-08 10:58 刘小子 阅读(158) 评论(0) 推荐(0) 编辑
摘要:大数据和云计算究竟有什么关系?周围总是充斥着大数据和云计算这两个词,然而,实际上,很多人对于云计算和大数据的关系却总是容易混淆,所以总是将“云计算”和“大数据”放在一起讨论,实则不然。简单来说:云计算是硬件资源的虚拟化,而大数据是海量数据的高效处理。虽然从这个解释来看也不是完全贴切,但是却可以... 阅读全文
posted @ 2016-05-08 10:58 刘小子 阅读(175) 评论(0) 推荐(0) 编辑
摘要:大数据对智能化发展有着怎样的影响力说到头条,很多人会想到“黑马”、“大杂烩”、“大数据”等关键词,说是黑马因为谁也没想到,没有过硬的背影,在移动互联网爆发之际杀出了个“今日头条”;大杂烩则是这款聚合类资讯软件包囊了事态万千稀奇古怪的事,而大数据则是在万千复杂的资讯中,他能很精确的推送给用户想要... 阅读全文
posted @ 2016-05-08 10:26 刘小子 阅读(165) 评论(0) 推荐(0) 编辑
摘要:大数据对智能化发展有着怎样的影响力说到头条,很多人会想到“黑马”、“大杂烩”、“大数据”等关键词,说是黑马因为谁也没想到,没有过硬的背影,在移动互联网爆发之际杀出了个“今日头条”;大杂烩则是这款聚合类资讯软件包囊了事态万千稀奇古怪的事,而大数据则是在万千复杂的资讯中,他能很精确的推送给用户想要... 阅读全文
posted @ 2016-05-08 10:26 刘小子 阅读(192) 评论(0) 推荐(0) 编辑
摘要:如何利用市场细分方法构建更好的预测模型?我们使用线性或者逻辑回归模型来开发精确模型,为了预测相关的输出结果。我们经常为分割的部分分别创建模型。为了判断它们的有效性,我们可以利用细分方法:如CHIAD或者CRT。但是,这真的有必要吗?我们可不可以创建一个单独的模型和使它含有区融变量作为模型的输入... 阅读全文
posted @ 2016-05-07 18:48 刘小子 阅读(248) 评论(0) 推荐(0) 编辑
摘要:如何利用市场细分方法构建更好的预测模型?我们使用线性或者逻辑回归模型来开发精确模型,为了预测相关的输出结果。我们经常为分割的部分分别创建模型。为了判断它们的有效性,我们可以利用细分方法:如CHIAD或者CRT。但是,这真的有必要吗?我们可不可以创建一个单独的模型和使它含有区融变量作为模型的输入... 阅读全文
posted @ 2016-05-07 18:48 刘小子 阅读(135) 评论(0) 推荐(0) 编辑
摘要:企业数据的六个方面用途对于企业而言,大数据的数据来源主要有两部分,一部分来自于企业内部自身的信息系统中产生的运营数据,这些数据大多是标准化、结构化的。(若继续细化,企业内部信息系统又可分两类,一类是“基干类系统”,用来提高人事、财会处理、接发订单等日常业务的效率;另一类是“信息类系统”,用于支... 阅读全文
posted @ 2016-05-07 08:43 刘小子 阅读(381) 评论(0) 推荐(0) 编辑
摘要:大数据是否有可能有效配置资源?这个问题非常棒,不过我不确定它是不是能在知乎上得到令人满意的回答。这个问题属于经济学和数学交界处的机制设计领域,需要的知识非常艰涩,也基本不可能简化。因为自己也不太了解,所以这里只能提供一个直觉上的答案。先摆结论:题主的设想应该是不可能实现的,但如果把范围限制到一... 阅读全文
posted @ 2016-05-06 20:01 刘小子 阅读(221) 评论(0) 推荐(0) 编辑
摘要:在大数据时代,我们需要数据售货员一直以来,IT产业被奉为高新技术产业,尽管业内经常有各种调侃的声音,但IT业在一般人的印象中还是与科技、潮流等字眼相关。随着全社会信息需求的多样化、消费化,以及青年一代计算机技能的不断提高,原有的“随时随地”信息获取不断被赋予新的意义——用户已经不再满足于通过他... 阅读全文
posted @ 2016-05-06 14:03 刘小子 阅读(116) 评论(0) 推荐(0) 编辑
摘要:在大数据时代,我们需要数据售货员一直以来,IT产业被奉为高新技术产业,尽管业内经常有各种调侃的声音,但IT业在一般人的印象中还是与科技、潮流等字眼相关。随着全社会信息需求的多样化、消费化,以及青年一代计算机技能的不断提高,原有的“随时随地”信息获取不断被赋予新的意义——用户已经不再满足于通过他... 阅读全文
posted @ 2016-05-06 14:03 刘小子 阅读(113) 评论(0) 推荐(0) 编辑
摘要:粗糙的贝叶斯转化概率预测模型转化率是网站分析中最受关注的指标之一,如何设定转化率目标?哪些用户最有可能转化?他们有哪些特征?如何发现并找到这些用户?这些都是负责网站运营和市场营销的同学最关注的问题。本篇文章通过贝叶斯算法对网站中已经完成转化的历史用户数据进行分析,发现购买转化用户的特征,并通过... 阅读全文
posted @ 2016-05-05 20:31 刘小子 阅读(367) 评论(1) 推荐(0) 编辑
摘要:粗糙的贝叶斯转化概率预测模型转化率是网站分析中最受关注的指标之一,如何设定转化率目标?哪些用户最有可能转化?他们有哪些特征?如何发现并找到这些用户?这些都是负责网站运营和市场营销的同学最关注的问题。本篇文章通过贝叶斯算法对网站中已经完成转化的历史用户数据进行分析,发现购买转化用户的特征,并通过... 阅读全文
posted @ 2016-05-05 20:31 刘小子 阅读(172) 评论(0) 推荐(0) 编辑
摘要:如何成为合格的数据分析师基本技术怎么强调都不过分。这里的术更多是(计算机、统计知识),多年做数据分析、数据挖掘的经历来看、以及业界朋友的交流来看,这点大家深有感触的。数据库查询—SQL数据分析师在计算机的层面的技能要求较低,主要是会SQL,因为这里解决一个数据提取的问题。有机会可以去逛逛一些专... 阅读全文
posted @ 2016-05-05 20:28 刘小子 阅读(151) 评论(0) 推荐(0) 编辑
摘要:线性回归介绍之一线性回归在所有的统计方法中绝对占有不可忽视的一席之地,其用途之广泛毋庸置疑,更重要的是它是整个回归家族中最为简单、也最容易理解的方法,几乎所有的统计学教材,不管是医学统计还是社会统计抑或经济统计,线性回归绝对会有独立的章节,而其他的回归方法则很少有这种待遇。线性回归大致可分为单... 阅读全文
posted @ 2016-05-05 09:05 刘小子 阅读(148) 评论(0) 推荐(0) 编辑
摘要:线性回归介绍之一线性回归在所有的统计方法中绝对占有不可忽视的一席之地,其用途之广泛毋庸置疑,更重要的是它是整个回归家族中最为简单、也最容易理解的方法,几乎所有的统计学教材,不管是医学统计还是社会统计抑或经济统计,线性回归绝对会有独立的章节,而其他的回归方法则很少有这种待遇。线性回归大致可分为单... 阅读全文
posted @ 2016-05-05 09:05 刘小子 阅读(137) 评论(0) 推荐(0) 编辑
摘要:数据分析师:避免低质量数据的5个方法数据科学家的最怕的是低质量的数据。因为哪怕你发明出世界上最聪明的算法,这些算法碰到低质量数据便毫无用处。正如我们常说的,“垃圾数据入,垃圾数据出”。我最近在为一个大型的石油天然气公司工作。为提升炼油厂的安全性,我协助他们采用一个更加基于风险的检验策略。为了能... 阅读全文
posted @ 2016-05-04 21:12 刘小子 阅读(109) 评论(0) 推荐(0) 编辑
摘要:数据分析师:避免低质量数据的5个方法数据科学家的最怕的是低质量的数据。因为哪怕你发明出世界上最聪明的算法,这些算法碰到低质量数据便毫无用处。正如我们常说的,“垃圾数据入,垃圾数据出”。我最近在为一个大型的石油天然气公司工作。为提升炼油厂的安全性,我协助他们采用一个更加基于风险的检验策略。为了能... 阅读全文
posted @ 2016-05-04 21:12 刘小子 阅读(319) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示