07 2019 档案

摘要:伴随着对人的了解逐步深入,一个概念悄然而生:用户画像(UserProfile),完美地抽象出一个用户的信息全貌,可以看作企业应用大数据的根基。 一、什么是用户画像? 男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。 这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信 阅读全文
posted @ 2019-07-30 23:06 天下尽好 阅读(5458) 评论(0) 推荐(0)
摘要:推荐系统实践 对于推荐系统,本文总结内容,如下图所示: 推荐系统.png 文章很长,你可以跳着看你感兴趣的部分。 一、什么是推荐系统 1. 为什么需要推荐系统 结论是,为了解决互联网时代下的信息超载问题。 看个数据: 据IDC《数字宇宙》的研究报告表明,2020 年全球新建和复制的信息量将超过40Z 阅读全文
posted @ 2019-07-30 23:05 天下尽好 阅读(3024) 评论(0) 推荐(0)
摘要:一、推荐系统概述 1.1 概述 推荐系统目前几乎无处不在,主流的app都基本应用到了推荐系统。例如,旅游出行,携程、去哪儿等都会给你推荐机票、酒店等等;点外卖,饿了么、美团等会给你推荐饭店;购物的时候,京东、淘宝、亚马逊等会给你推荐“可能喜欢”的物品;看新闻,今日头条、腾讯新闻等都会给你推送你感兴趣 阅读全文
posted @ 2019-07-30 23:03 天下尽好 阅读(857) 评论(0) 推荐(0)
摘要:一、多元回归分析简介 用回归方程定量地刻画一个应变量与多个自变量间的线性依存关系,称为多元回归分析(multiple linear regression),简称多元回归(multiple regression)。 多元回归分析是多变量分析的基础,也是理解监督类分析方法的入口!实际上大部分学习统计分析 阅读全文
posted @ 2019-07-28 22:32 天下尽好 阅读(20292) 评论(0) 推荐(0)
摘要:Elasticsearch简介 Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,也可以将这三者进行组合。 Elasticsearch是一个建立在全文搜索引擎 Apache Lucene™ 基础上的搜索 阅读全文
posted @ 2019-07-21 11:01 天下尽好 阅读(6766) 评论(0) 推荐(0)
摘要:编者按:本文是松子(李博源)的大数据平台发展史系列文章的第四篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统行业与非传统行业。是对数据平台发展的一个回忆,对非互联网、互联网,从数据平台的用户角度、数据架构演进、模型等进行了阐述。 在互联网时代被弱化的数据模型 谈起数据模型就不 阅读全文
posted @ 2019-07-12 18:00 天下尽好 阅读(665) 评论(0) 推荐(0)
摘要:编者按:本文是松子(李博源)的大数据平台发展史系列文章的第二篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统与非传统两个行业。是对数据平台发展的一个回忆,对非互联网、互联网,从数据平台的用户角度、数据架构演进、模型等进行了阐述。 前言,”数据模型“ 这个词只要是跟数据沾边就会 阅读全文
posted @ 2019-07-12 17:59 天下尽好 阅读(377) 评论(0) 推荐(0)
摘要:编者按:本文是松子(李博源)的大数据平台发展史系列文章的第二篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统与非传统两个行业。是对数据平台发展的一个回忆,对非互联网、互联网,从数据平台的用户角度、数据架构演进、模型等进行了阐述。 前言,本篇幅将进入大家熟知的互联网时代,数据平 阅读全文
posted @ 2019-07-12 17:59 天下尽好 阅读(400) 评论(0) 推荐(0)
摘要:编者按:本文是松子(李博源)的大数据平台发展史系列文章的第一篇(共四篇),本系列以独特的视角,比较了非互联网和互联网两个时代以及传统与非传统两个行业。是对数据平台发展的一个回忆,对非互联网、互联网,从数据平台的用户角度、数据架构演进、模型等进行了阐述。 前言,这个数据平台发展史仅是自己经历过由传统数 阅读全文
posted @ 2019-07-12 17:58 天下尽好 阅读(620) 评论(0) 推荐(0)
摘要:整体结构 在具体分析数据仓库之前先看下一下数据中心的整体架构以及数据流向 数据中心整体架构.png DB 是现有的数据来源,可以为mysql、SQLserver、文件日志等,为数据仓库提供数据来源的一般存在于现有的业务系统之中。 ETL的是 Extract-Transform-Load 的缩写,用来 阅读全文
posted @ 2019-07-12 17:46 天下尽好 阅读(3526) 评论(0) 推荐(0)
摘要:作为产品总监,要面对的群体和要做的事儿 面对的群体(三角关系) 1. 老板与投资人(为什么做?Why) 老板与投资人会指出大的方向,通常是描述大的赛道和市场机会,但是如何在这个市场里抓住机会,还需要再细化,当然有可能老板与投资人也会有分歧 2. 用户与市场(做什么?What) 知道赛道和方向在哪里了 阅读全文
posted @ 2019-07-09 18:42 天下尽好 阅读(1326) 评论(0) 推荐(1)
摘要:本文首先详细介绍了数据工程的职责、与数据科学家之间的差别以及其不同的工作角色,然后重点列出了很多与核心技能相关的的优秀学习资源,最后介绍行业内认可度较高的3种数据工程认证。 简介 在建立模型之前,在数据经过清洗用于探索分析之前,甚至在数据科学家工作开始之前,数据工程师就已经闪亮登场了。每一个数据驱动 阅读全文
posted @ 2019-07-08 16:38 天下尽好 阅读(1387) 评论(0) 推荐(0)
摘要:随着物联网技术和应用的普及,以运营商、互联网以及实体经济行业为代表的企业产生了越来越多的数据,大数据的发展越来越蓬勃。 从2007年开始,大数据应用成为很多企业的需求,2012年兴起并产生了大数据平台,使用者主要是程序员;2013年到2017年间,数据逐渐增多,大数据平台变成了融合大数据平台,使用者 阅读全文
posted @ 2019-07-08 12:19 天下尽好 阅读(1426) 评论(0) 推荐(0)
摘要:近日,Ramesh Dontha 在 DataConomy 上连发两篇文章,扼要而全面地介绍了关于大数据的 75 个核心术语,这不仅是大数据初学者的很好的入门资料,对于高阶从业人员也可以起到查缺补漏的作用。本文分为上篇(25 个术语)和下篇(50 个术语)。机器之心对文章进行了编译,原文链接请见文末 阅读全文
posted @ 2019-07-01 16:04 天下尽好 阅读(1949) 评论(0) 推荐(0)