摘要: US_2019COVID 介绍 2020年美国新冠肺炎疫情数据分析–截止2020年9月9日 数据处理 使用Spark对数据进行分析 数据可视化 一、数据处理 1. 数据集分析 ![data](https://imgconvert.csdnimg.cn/aHR0cHM6Ly9naXRlZS5jb20v 阅读全文
posted @ 2021-06-29 17:56 老酱 阅读(826) 评论(0) 推荐(0) 编辑
摘要: 抖音从2018年初爆火到现在仍旧活跃,据统计用户活跃度第3名。活跃度跃持续增长9.5%。那抖音如此火爆作为一个信息流投放人来说是不是应该更深入的了解一下抖音这个产品呢? 本文是关于抖音2019年的产品分析报告,一起来看看吧~ 一、惊人的用户活跃度 短视频是指视频长度显著短于传统视频,通过手机终端实现 阅读全文
posted @ 2021-06-29 17:54 老酱 阅读(6395) 评论(0) 推荐(0) 编辑
摘要: 2019腾讯暑期实习常规批笔试技术研究与数据分析卷编程题 题一 数字拆分 解题思路 注意点 解析 python实现 代码解释 题二 水果运费 解题思路 注意点 解析 python实现 代码解释 题三 找最小数 解题思路 注意点 解析 python实现 代码解释 题一 数字拆分 一个数字有两种操作,1 阅读全文
posted @ 2021-06-29 17:52 老酱 阅读(157) 评论(0) 推荐(0) 编辑
摘要: 在当下这个快速发展的信息化时代,对于企业经营来讲,掌握一些大数据分析软件工具来支持经营决策也是至关重要的。 2019年商业数据分析软件有哪些呢?本文列出了市面上最主要的几款数据分析软件。 1.FineBI 目前国内数据分析的佼佼者。FineBI是新一代自助式BI工具,企业客户多、服务范围广, 多维O 阅读全文
posted @ 2021-06-29 17:51 老酱 阅读(1454) 评论(0) 推荐(0) 编辑
摘要: 大数据时代,需要工具实现数据可视化,需要倚仗大数据可视化工具,这些工具中不乏有适用于Flash、HTML5、NET、Java、Flex等平台的,也不乏有适用于常规图表报表、金融图表、工控图表、甘特图、流程图、数据透视表、OLAP多维分析等图表报表开发的。 为了进一步让大家了解如何选择适合的数据可视化 阅读全文
posted @ 2021-06-29 17:49 老酱 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 现如今,整个互联网已经进入 大数据时代 ,“大数据”一词的重点现也已经不仅在于数据规模的定义,它更代表着信息技术发展进入了一个新的里程,代表着爆炸性的数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处理所需的新的技术和方法,也代表着 大数据分析 和应用所带来的新发明、新服务和新的 阅读全文
posted @ 2021-06-29 17:47 老酱 阅读(1626) 评论(0) 推荐(0) 编辑
摘要: 1电商平台零售数据分析 环境为Anaconda3,Python3.8,用JupyterNotebook写的 数据文件在百度网盘 链接:https://pan.baidu.com/s/1DwWF4Vpduj8SqRUUezt4ew 提取码:2222 import plotly as py py.off 阅读全文
posted @ 2021-06-29 17:46 老酱 阅读(427) 评论(0) 推荐(0) 编辑
摘要: 0408数据分析基础 1、数据分析作用 2、数据分析的指标 3、数据分析的常规流程 1、数据分析作用 数据分析可以把隐藏在大量数据背后的信息提取出来,总结出数据的内在规律。 数据分析在企业日常经营分析中有三大作用,现状分析、原因分析、预测分析。 现状分析:业务在过去发生了什么?(现阶段整体运营情况+ 阅读全文
posted @ 2021-06-29 17:45 老酱 阅读(313) 评论(0) 推荐(0) 编辑
摘要: 主要内容: 1、r语言爬虫 rvest包的使用。 2、r语言字符串处理stringr包的使用。 3、r语言聚合dplyr 包的使用。 4、r语言可视化ggplot 包的使用。 5、r语言画词云图worldcloud2 包的使用。 6、正则表达式 str_match 的使用 7、sapply的用法。 阅读全文
posted @ 2021-06-29 17:44 老酱 阅读(441) 评论(0) 推荐(0) 编辑
摘要: 【Python有趣打卡】数据分析pandas完成数据分析项目 ![](https://img-blog.csdnimg.cn/20190306201535208.png?x-oss- process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10 阅读全文
posted @ 2021-06-29 17:43 老酱 阅读(255) 评论(0) 推荐(0) 编辑
摘要: 背景介绍: 我们采用的数据是:根据汽车的多种细节,如:车门数量,后备箱大小,维修成本等,来确定汽车质量。 最后的分类目的是把车辆的质量分为4中类型,不达标,达标,良好,优秀。点击: [ 数据集下载 ](https://archive.ics.uci.edu/ml/datasets/Car+Evalu 阅读全文
posted @ 2021-06-29 17:40 老酱 阅读(347) 评论(0) 推荐(0) 编辑
摘要: 背景介绍: 我们采用的数据是:根据汽车的多种细节,如:车门数量,后备箱大小,维修成本等,来确定汽车质量。 最后的分类目的是把车辆的质量分为4中类型,不达标,达标,良好,优秀。点击: [ 数据集下载 ](https://archive.ics.uci.edu/ml/datasets/Car+Evalu 阅读全文
posted @ 2021-06-29 17:38 老酱 阅读(628) 评论(0) 推荐(0) 编辑
摘要: 【数据挖掘】金融风控 Task02 数据分析 探索性数据分析(EDA)概述 1 探索性数据分析概念 1.2 探索性数据分析目的 1.3 探索性数据分析(EDA)与传统统计分析(Classical Analysis)的区别 金融风控实战 2.1 导入所需要的库 2.2 文件读取 2.2.1 TSV和C 阅读全文
posted @ 2021-06-29 17:36 老酱 阅读(518) 评论(0) 推荐(0) 编辑
摘要: 基于Streamlit制作的时间序列数据分析APP 1.为什么要使用Streamlit( 官网介绍链接 ) 在数据科学领域,一方面,当我们在学习或者实践机器学习算法的时候,需要进行一些参数调整;另一方面,我们也希望将最后的成果通过一种友好的可视化效果呈现出来。 虽然可以通过Django、Flask等 阅读全文
posted @ 2021-06-29 17:35 老酱 阅读(888) 评论(0) 推荐(0) 编辑
摘要: 文章目录 实验环境的搭建 Numpy入门 Pandas入门 Pandas玩转数据 绘图和可视化之Matplotlib 绘图和可视化之Seaborn 数据分析项目实战 小试牛刀 复习 以下为章节具体目录章节目录 实验环境的搭建 [ Jupyter-notebook的使用演示 ](https://blo 阅读全文
posted @ 2021-06-29 17:31 老酱 阅读(399) 评论(0) 推荐(0) 编辑
摘要: 在数据分析和可视化中最有用的 50 个 Matplotlib 图表。 这些图表列表允许使用 python 的 matplotlib 和 seaborn 库选择要显示的可视化对象。 这里开始第二部分内容:偏差(Deviation) 准备工作 在代码运行前先引入下面的设置内容。 当然,单独的图表,可以重 阅读全文
posted @ 2021-06-29 17:29 老酱 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 本文总结了 Matplotlib 以及 Seaborn 用的最多的 50 个图形,掌握这些图形的绘制,对于数据分析的可视化有莫大的作用,运行本文代码,除了安装 matplotlib 和 seaborn 可视化库外,还需要安装其他的一些辅助可视化库,已在代码部分作标注,具体内容请查看下面内容。 在数据 阅读全文
posted @ 2021-06-29 17:28 老酱 阅读(575) 评论(0) 推荐(0) 编辑
摘要: 项目背景: 客户是一个电影制作的新公司,他们将制作一部新电影。客户想确保电影能够成功,从而使新公司立足市场。 提出问题: 电影类型是如何随着时间的推移发生变化的? Universal Pictures 和 Paramount Pictures 之间的对比情况如何? 改编电影和原创电影的对比情况如何? 阅读全文
posted @ 2021-06-29 17:26 老酱 阅读(376) 评论(0) 推荐(0) 编辑
摘要: 所谓关联,反映的是一个事件和其他事件之间依赖或关联的知识。当我们查找英文文献的时候,可以发现有两个英文词都能形容关联的含义。第一个是相关性relevance,第二个是关联性association,两者都可以用来描述事件之间的关联程度。其中前者主要用在互联网的内容和文档上,比如搜索引擎算法中文档之间的 阅读全文
posted @ 2021-06-29 17:05 老酱 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 日常工作中,分析师会接到一些专项分析的需求,首先会搜索脑中的分析体悉,根据业务需求构建相应的分析模型(不只是机器学习模型),根据模型填充相应维度表,这些维度特征表能够被使用的前提是假设已经清洗干净了。 但真正的原始表是混乱且包含了很多无用的冗余特征,所以能够根据原始数据清洗出相对干净的特征表就很重要 阅读全文
posted @ 2021-06-29 17:03 老酱 阅读(535) 评论(0) 推荐(0) 编辑