2019年4月20日

python--学习笔记11 pandas groupby

摘要: 在没有数据库的情况下,可以用pandas进行简单的分组函数处理情况。 max min sum mean quantile(0.75) 求样本分位数 经常用到stack和unstack两个函数。stack的意思是堆叠,堆积,unstack即“不要堆叠”。表格在行列方向上均有索引(类似于DataFram 阅读全文

posted @ 2019-04-20 00:42 椰汁黑糯米 阅读(260) 评论(0) 推荐(0) 编辑

2019年3月29日

tableau--学习笔记2 地图及计算函数

摘要: tableau 10.5版本 ZN函数是指如果括号里的表达式结果不为NULL,则返回它,否则返回0。用这个函数主要是处理NULL值。 用 ZN 函数处理数据缺失点。 如果数据缺失点是空值,我们可以使用 IFNULL 函数。但实际情况是没有数据,我们就得用到另外一个函数 ZN。 针对需要转置的数据 , 阅读全文

posted @ 2019-03-29 12:05 椰汁黑糯米 阅读(316) 评论(0) 推荐(0) 编辑

2019年3月11日

(转)用户运营4大策略体系搭建:增长框架+用户建模+场景化分层+数据运营

摘要: http://www.woshipm.com/user-research/1053413.html 作者是做社区o2o用户运营的,总结了4个策略体系。 增长框架:用户增长团队+核心增长渠道+增长工具。 用户建模:用户模型搭建,包含标签画像、用户价值模型、用户偏好识别模型、用户流失预警模型、用户活跃度 阅读全文

posted @ 2019-03-11 15:15 椰汁黑糯米 阅读(734) 评论(0) 推荐(0) 编辑

Python--学习笔记10 openpyxl

摘要: openpyxl可以实现对于xlsx文件的读取写入修改等操作,这边简单的把第18列的数据,>0的数字减少1写入原列,但是读取大文件的时候好慢啊,并且希望可以加一个进度条,查看到底完成了多少。 阅读全文

posted @ 2019-03-11 14:23 椰汁黑糯米 阅读(144) 评论(0) 推荐(0) 编辑

2019年3月6日

kettle

摘要: 出现couldn't be found in the input stream!报错 是在选择Excel表格输出的时候,没有在内容部分获取字段。 还可以选择stream xlsx data。 阅读全文

posted @ 2019-03-06 15:56 椰汁黑糯米 阅读(587) 评论(0) 推荐(0) 编辑

python--学习笔记9 绘图

摘要: import matplotlib.pyplot as plt fig = plt.figure() matplotlib的图像都位于figure对象中。不能通过空的figure绘图,需要使用add_subplot创建一个或多个subplot。 %matplotlib inline jupyter 阅读全文

posted @ 2019-03-06 13:33 椰汁黑糯米 阅读(136) 评论(0) 推荐(0) 编辑

2019年3月4日

机器学习---概念基础

摘要: 分类:针对离散型数据 回归:针对连续型数据 代价函数就是目标函数和实际训练集的误差 平方误差代价函数可能是解决回归问题最常用的手段。 https://study.163.com/course/courseLearn.htm?courseId=1004570029#/learn/video?lesso 阅读全文

posted @ 2019-03-04 18:04 椰汁黑糯米 阅读(86) 评论(0) 推荐(0) 编辑

2019年2月22日

shell 基础

摘要: 介绍 Shell本身是一个用C语言编写的程序,它是用户使用Unix/Linux的桥梁,用户的大部分工作都是通过Shell完成的。Shell既是一种命令语言,又是一种程序设计语言。作为命令语言,它交互式地解释和执行用户输入的命令;作为程序设计语言,它定义了各种变量和参数,并提供了许多在高级语言中才具有 阅读全文

posted @ 2019-02-22 14:42 椰汁黑糯米 阅读(142) 评论(0) 推荐(0) 编辑

2019年2月19日

BI分析系统设计方案

摘要: 编写目的,为管理人员、业务人员提供信息查询、展示、分析等决策支持的信息服务。 通过多维度的报表展示,反映公司经营和管理状况。 基于公司数据,提供统计分析报表。 为产品及公司发展方向提供指导。 设计原则需要考虑实用性、规范性、安全性、可修改以及可延展性。 软件平台,oracle- BIEE ODS层是 阅读全文

posted @ 2019-02-19 11:03 椰汁黑糯米 阅读(1129) 评论(0) 推荐(0) 编辑

2019年1月23日

python--学习笔记8 数据规整化,清理、转换、合并、重塑

摘要: 合并数据集 pandas.merge可根据一个或多个键将不同的DataFrame中的行连接起来。 pandas.concat可以沿着一条轴将多个对象堆叠到一起。 combine_first可以将重复数据编接在一起,用一个对象中的值去填充另一个对象中的缺失值,有点像数据库中的全外连接。 数据集的合并( 阅读全文

posted @ 2019-01-23 09:01 椰汁黑糯米 阅读(242) 评论(0) 推荐(0) 编辑

导航