关闭页面特效

08 2020 档案

摘要：上一篇数据中台的实战文章讲了《数据中台实战（九）：如何搭建全渠道自动化的平台》，这次我们基于实战看一下如何从0到1搭建推荐平台。一、什么是推荐系统推荐系统的核心是要解决人货匹配的问题。我们拿电商平台举例，作为一个电商平台，就是为了卖货，怎么把我们的货卖出去并且用户还比较满意呢？一定是找到有需求阅读全文

posted @ 2020-08-25 14:40 大码王阅读(837) 评论(0) 推荐(0) 编辑

数据中台实战（九）：如何搭建全渠道自动化的营销平台

摘要：上一篇数据中台的实战文章讲了《数据中台实战（八）：如何打造可以支撑N条产品线的标签平台》，这次讲如何搭建全渠道自动化的营销平台。什么是全渠道营销平台先讲一下全渠道营销平台是什么。运营的大部分工作就是搞营销活动，刺激用户下单和复购。在很久很久以前，一个公司几个月才搞一次活动，为什么要几个月，因为从阅读全文

posted @ 2020-08-25 14:39 大码王阅读(809) 评论(0) 推荐(0) 编辑

数据中台实战（八）：如何打造支撑N条产品线的标签平台

摘要：上一篇数据中台的实战文章讲了《数据中台实战（七）：流量分析》，这次讲如何打造可以支撑N条产品线的标签平台。为什么要建设标签平台亚马逊的CEO Jeff Bezos曾说过他的梦想，「如果我有一百万的用户，我就会做一百万个不同的网站！」。当然，现在大型的电商公司如亚马逊、淘宝等已经实现了他这个梦想阅读全文

posted @ 2020-08-25 14:37 大码王阅读(651) 评论(0) 推荐(0) 编辑

数据中台实战（七）：流量分析

摘要：上一篇文章讲了《数据中台实战（六）：交易分析》，本文讲数据中台实战（七）：流量分析。流量分析的核心就是你的平台每天有多少个用户过来，都去了哪里，在那个位置产生了消费。针对这几个问题，我们做了几个功能：网页分析，可以监测每个网页的流量PV、UV、浏览时长、跳出率；坑位流量分析，可以看到产品的每阅读全文

posted @ 2020-08-25 14:36 大码王阅读(456) 评论(0) 推荐(0) 编辑

数据中台实战（六）：交易分析

摘要：上一篇文章讲到《数据中台实战（五）：自助分析平台》，本篇文章讲一下交易分析模块。交易分析设计原则交易数据是一个公司最核心的数据，领导层会十分关注，一线的运营的kpi也是围绕交易额展开。领导层和一线的运营还是有些不同，公司领导层关注的是大盘，是不会看一些明细数据，而运营需要大量的明细数据来分析数据阅读全文

posted @ 2020-08-25 14:34 大码王阅读(534) 评论(0) 推荐(0) 编辑

数据中台实战（五）：自助分析平台（产品设计篇）

摘要：本文笔者详细介绍了开发自助分析平台的重要性、自助分析平台的具体方案和选型，一起来看看吧。一、为什么要开发自助分析平台上一篇文章讲到《数据中台实战入门篇：数据中台对内、对外合作机制》。这时数据中台团队已经做了几个比较大块的功能模块，和各个产品线的合作越来越紧密。每个月每条产品线都有一些数据需求，阅读全文

posted @ 2020-08-25 14:32 大码王阅读(1029) 评论(0) 推荐(0) 编辑

数据中台实战（四）：商品分析（产品设计篇）

摘要：商品的生命周期分为售前、售中、售后，接下来结合数据中台实战，分别从三个时期的细节方面分析下，如何保证我们提供的都是真正的好货。上一讲讲了用户模块《数据中台实战（三）：用户分析（产品设计篇）》我们用的是海盗模型，从用户的获取、激活、留存、收入、推荐的角度来做分析。这些指标是没问题，但是作为电商产品，阅读全文

posted @ 2020-08-25 14:30 大码王阅读(576) 评论(0) 推荐(0) 编辑

数据中台实战（三）：用户分析（产品设计篇）

摘要：上一次说到《数据中台实战（二）：基于阿里OneData的数据指标管理体系》，这次我们谈下产品经理更加关注的模块产品设计。接下来的文章将从六个方面讲数据中台的产品设计包括用户分析、商品分析、活动分析、流量分析、还有自助分析平台、标签平台、推荐系统的搭建。全部基于实战，读完这个系列，你就可以搭建属于你们阅读全文

posted @ 2020-08-25 14:29 大码王阅读(755) 评论(0) 推荐(0) 编辑

数据中台实战（二）：基于阿里OneData的数据指标管理体系

摘要：本文将通过具体案例来介绍OneData的实施流程，继而介绍阿里OneData数据体系中数据指标的管理和数据模型的设计，最后再为大家讲数据看板的设计。上一篇文章讲了《数据中台实战（一）：以B2B点电商为例谈谈产品经理下的数据埋点》，本文我们先以一个例子实战介绍OneData实施流程。接着再讲阿里On 阅读全文

posted @ 2020-08-25 14:26 大码王阅读(1146) 评论(0) 推荐(0) 编辑

数据中台实战（一）：以B2B电商亿订为例，谈谈产品经理视角下的数据埋点

摘要：本文以B2B电商产品“亿订”为实例，与大家一同谈谈数据中台的数据埋点。笔者所在公司为富力环球商品贸易港，是富力集团旗下汇聚原创设计师品牌及时尚买手/采购商两大社群，通过亿订B2B电商、RFSHOWROOM、环贸快版、环贸映像、富运通、富贸通等子品牌为时尚行业提供一站式产业＋渠道服务的平台。笔者所阅读全文

posted @ 2020-08-25 14:17 大码王阅读(753) 评论(0) 推荐(0) 编辑

数据中台实战（零）数据中台如何搭建

摘要：4月29日，数据中台建设实战系列课程「数智加速度」第4课，奇点云数据模型架构专家天启带来分享《AI驱动的数据中台架构设计》，步步踏实落地，带大家从0开始建设数据中台。天启，奇点云数据模型架构专家、原海尔集团数据架构师、原阿里巴巴政务团队数据架构师，精通数据仓库建模理论及数据开发技术，具备零售、政务阅读全文

posted @ 2020-08-21 10:01 大码王阅读(5122) 评论(1) 推荐(0) 编辑

大数据集群运维（36）linux下的几个网络流量监控工具使用

摘要：1、nethogs 1)NetHogs是一款开源、免费的，终端下的网络流量监控工具，它可监控Linux的进程或应用程序的网络流量。NetHogs只能实时监控进程的网络带宽占用情况。NetHogs支持IPv4和IPv6协议，支持本地网卡以及PPP链接 2)debian下安装 apt-get insta 阅读全文

posted @ 2020-08-14 16:07 大码王阅读(691) 评论(0) 推荐(0) 编辑

SparkStreaming入门到实战之(17)--大数据场景下数据异构之 Mysql实时写入HBase（借助canal kafka SparkStreaming）

摘要：背景：公司线下ETC机房有个Mycat集群，供订单系统使用，现需要进行数据异构将Mysql数据(近)实时写入另一套数据库用作读请求和数据归档用技术选型：binlog解析工具：阿里开源的canal 消息中间件：kafka 流式框架：SparkStreaming 上代码 canal解析mysqlbin 阅读全文

posted @ 2020-08-14 10:40 大码王阅读(411) 评论(0) 推荐(0) 编辑

SparkStreaming入门到实战之(16)--基于Spark Streaming + Canal + Kafka对Mysql增量数据实时进行监测分析

摘要：1.Canal是什么？2.如何编写Canal客户端？3.如何编写一个数据库操作的Spark程序代码？4.开发Spark项目时容易发生哪些冲突问题？Spark中的Spark Streaming可以用于实时流项目的开发，实时流项目的数据源除了可以来源于日志、文件、网络端口等，常常也有这种需求，那就是实时阅读全文

posted @ 2020-08-13 14:31 大码王阅读(360) 评论(0) 推荐(0) 编辑

大数据集群运维（35）sqoop安装与使用

摘要：sqoop 是什么：在关系数据库和hadoop之间数据的相互转换的工具。安装：原生安装：appache１．解压安装，２．重命名sqoop-1.4.5-cdh5.4.4/sqoop-env-template.sh 为sqoop-env.sh３．修改sqoop-env.sh配置：填写Hadoop，hba 阅读全文

posted @ 2020-08-13 11:41 大码王阅读(364) 评论(0) 推荐(0) 编辑

大数据集群运维（34）flume安装与使用

摘要：1.flume简介 Flume是Cloudera提供的日志收集系统，Flume支持在日志系统中定制各类数据发送方，用于收集数据；同时，Flume提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。 Flume是一个分布式、可靠、和高可用的海量日志采集、聚合和传输的系统。 2.安装和使用说明阅读全文

posted @ 2020-08-13 11:38 大码王阅读(220) 评论(0) 推荐(0) 编辑

大数据集群运维（33）MongoDB各系统上安装

摘要：MongoDB的文档模型自由灵活，可以让你在开发过程中畅顺无比。对于大数据量、高并发、弱事务的互联网应用，MongoDB可以应对自如。MongoDB内置的水平扩展机制提供了从百万到十亿级别的数据量处理能力，完全可以满足Web2.0和移动互联网的数据存储需求，其开箱即用的特性也大大降低了中小型网站的运阅读全文

posted @ 2020-08-13 11:32 大码王阅读(194) 评论(0) 推荐(0) 编辑

大数据集群运维（32）spark开发环境详细教程1：IntelliJ IDEA使用详细说明

摘要：各种开发环境的搭建，其实都是听简单。甚至我们可以通过命令行来开发。而且最原始的编程，其实可以通过文本或则cmd即可。还有maven，sbt等。后来的发展过程中，为了更加方便我们编程，于是发展出来了，更高级的编程工具，Java有eclipse等工具，而Scala有IntelliJ IDEA.当然ecl 阅读全文

posted @ 2020-08-13 11:30 大码王阅读(352) 评论(0) 推荐(0) 编辑

大数据集群运维（31）Spark提交任务时报beyond virtual memory limits错误

摘要：以Spark-Client模式运行，Spark-Submit时出现了下面的错误： User: hadoop Name: Spark Pi Application Type: SPARK Application Tags: YarnApplicationState: FAILED FinalStatu 阅读全文

posted @ 2020-08-11 22:30 大码王阅读(306) 评论(0) 推荐(0) 编辑

大数据集群运维（30）spark安装与使用（入门）

摘要：一：在linux下安装java环境（自行安装jdk）二：安装Scala2.9.3

t a r - z x f s c a l a - 2.9.3. t g z

$tar -zxf scala-2.9.3.tgz$ sudo mv scala-2.9.3 /usr/lib $ sudo vim /etc/profile # add the following lines 阅读全文

posted @ 2020-08-11 18:21 大码王阅读(465) 评论(0) 推荐(0) 编辑

大数据集群运维（29）Zeppelin-在flink和spark集群的安装

摘要：Zeppelin-在flink和spark集群的安装该教程主要面向Zeppelin的入门者。不需要太多的关于 Linux, git, 或其它工具的基础知识。如果你按照这里的方法逐项执行，就可以将 Zeppelin 正常运行起来。安装Zeppelin为Flink/Spark集群模式本教程假定用户阅读全文

posted @ 2020-08-11 17:50 大码王阅读(554) 评论(0) 推荐(0) 编辑

大数据集群运维（28） Kylin 配置使用 flink 构建 Cube

摘要：用 Flink 构建 Cube Kylin v3.1 引入了 Flink cube engine，在 build cube 步骤中使用 Apache Flink 代替 MapReduce；您可以查看 KYLIN-3758 了解具体信息。当前的文档使用样例 cube 对如何尝试 new engine 阅读全文

posted @ 2020-08-11 17:39 大码王阅读(776) 评论(0) 推荐(0) 编辑

大数据集群运维（27）Kylin 配置使用 Spark 构建 Cube

摘要：HDP版本：2.6.4.0 Kylin版本：2.5.1 机器：三台 CentOS-7，8G 内存 Kylin 的计算引擎除了 MapReduce ，还有速度更快的 Spark ，本文就以 Kylin 自带的示例 kylinsalescube 来测试一下 Spark 构建 Cube 的速度。一、配置阅读全文

posted @ 2020-08-11 17:05 大码王阅读(368) 评论(0) 推荐(0) 编辑

大数据集群运维（26）Apache Kylin 2.5.0安装和使用

摘要：1.背景 Apache Kylin是一个开源的分布式分析引擎，提供Hadoop之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay Inc. 开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。 Apache Kylin官网：http://kylin.apache.o 阅读全文

posted @ 2020-08-11 16:58 大码王阅读(503) 评论(0) 推荐(0) 编辑

大数据集群运维（25）CDH安装

摘要：CDH 安装市场上免费大数据框架主要有三个版本，原生的 Apache 版本，Cloudera(https://www.cloudera.com/) 公司研发的（Cloudera Distribution Hadoop，简称“CDH”）CDH 版本，也是市场上使用最多的，Hortonworks 版本阅读全文

posted @ 2020-08-11 16:44 大码王阅读(490) 评论(0) 推荐(0) 编辑

大数据集群运维（24）kylin 系列（一）安装部署

摘要：kylin 系列（一）安装部署一、环境说明 1.1 版本选择 cdh 版本下载地址：http://archive.cloudera.com/cdh5/cdh/5/ 软件名称版本 JDK 1.8 HADOOP Hadoop2.6.0-cdh5.10 ZOOKEERER 3.4.5 HBASE Hba 阅读全文

posted @ 2020-08-11 16:42 大码王阅读(411) 评论(0) 推荐(0) 编辑

人工智能深度学习入门练习之（38）深度学习 – tensorflow实例之keras的siamese(孪生网络)实现案例

摘要：一、 keras的siamese(孪生网络)实现案例二、代码实现 import keras import numpy as np import matplotlib.pyplot as plt import random from keras.callbacks import TensorBoar 阅读全文

posted @ 2020-08-07 09:56 大码王阅读(1053) 评论(0) 推荐(0) 编辑

人工智能深度学习入门练习之（37）深度学习 – TensorFlow实现CNN神经网络算法

摘要：一、CNN的引入在人工的全连接神经网络中，每相邻两层之间的每个神经元之间都是有边相连的。当输入层的特征维度变得很高时，这时全连接网络需要训练的参数就会增大很多，计算速度就会变得很慢，例如一张黑白的 28×2828×28 的手写数字图片，输入层的神经元就有784个，如下图所示：若在中间只使用一层隐阅读全文

posted @ 2020-08-06 18:29 大码王阅读(636) 评论(0) 推荐(1) 编辑

人工智能深度学习入门练习之（36）深度学习 – 使用深度学习实现智能聊天机器人

摘要：.聊天机器人的类型本文分为了哪些类型？2.聊天机器人的有几种主流技术？3.如何利用深度学习构建聊天机器人？聊天机器人（也可以称为语音助手、聊天助手、对话机器人等）是目前非常热的一个人工智能研发与产品方向。很多大型互联网公司投入重金研发相关技术，并陆续推出了相关产品，比如苹果Siri、微软Corta 阅读全文

posted @ 2020-08-06 17:35 大码王阅读(693) 评论(0) 推荐(0) 编辑

公告

青青陵上柏，磊磊涧中石。

运行时长：2251天4小时2分22秒

您的浏览器不兼容canvas

昵称：大码王
园龄： 5年8个月
粉丝： 232
关注： 30

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类 (719)

clickhouse(4)

flink源码分析(2)

Groovy(1)

Java(34)

Linux(3)

office(10)

OpenStack入门(1)

Phoenix+hbase(11)

photoshop(10)

python之绘图(7)

python之爬虫(15)

python之入门到实战(26)

shell大全(1)

SparkCore(14)

sparkGraphx(2)

sparksql(8)

sparkstreaming(17)

spark源码分析(11)

博客园美化(6)

操作系统(1)

随笔档案 (693)

2024年5月(4)

2024年3月(3)

2023年9月(1)

2023年4月(2)

2023年3月(4)

2023年2月(1)

2022年12月(1)

2022年11月(1)

2022年9月(2)

2022年8月(17)

2022年7月(5)

2022年5月(3)

2022年4月(18)

2021年9月(1)

2021年6月(9)

2021年5月(19)

2021年2月(1)

2021年1月(17)

2020年12月(7)

2020年11月(19)

文章分类 (35)

airflow(4)

azkban(1)

canal(1)

Cassandra(1)

datax(1)

druid(1)

Elasticsearch(8)

java(11)

mongodb(2)

redis(3)

scala(2)

文章档案 (40)

2024年4月(2)

2023年5月(2)

2023年4月(1)

2023年1月(1)

2020年6月(9)

2020年5月(25)

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类 (719)

随笔档案 (693)

文章分类 (35)

文章档案 (40)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

喜欢请打赏