摘要: 【牛客】网易2018实习生招聘笔试题——数据分析师实习生解析 选择题根据牛客网下方讨论整理,三道大题均为自己答案,欢迎大家讨论并给予指正。 ( [ https://www.nowcoder.com/test/10780714/summary ](https://www.nowcoder.com/te 阅读全文
posted @ 2021-06-28 15:21 老酱 阅读(454) 评论(0) 推荐(0) 编辑
摘要: 0x00 前言 最近很多小伙伴都来问居士入门数据分析看什么书比较好,之前一直没有写文章来回答是因为还有一两本书没翻完,自己没好好看的书,居士不太愿意分享的。 而,之前看到的很多别人的推荐书单也都是比较陈旧的那种,你抄我我抄你,内容也并不太适合入门,或者至少居士自己不太满意。 这次,推荐给大家的5本书 阅读全文
posted @ 2021-06-28 15:19 老酱 阅读(645) 评论(0) 推荐(0) 编辑
摘要: 美国工业互联网联盟(I IC)技术与架构任务组联执主席、Thingswise,LLC首席执行官/联合创始人林诗万先生认为,数据分析对推动智能制造具有核心作用,只有得到有作用的分析结果,智能制造才能得以实现。 ** ** 人工智能赛博物理操作系统 AI-CPS OS “ 人工智能赛博物理操作系统 ” 阅读全文
posted @ 2021-06-28 15:17 老酱 阅读(573) 评论(0) 推荐(0) 编辑
摘要: # coding:utf-8 """ logistic 回归, 自动建模 """ import pandas as pd # 参数初始化 filename = r"C:\learning\DataMining\Book\Python_DataMining\Data\chapter5\demo\dat 阅读全文
posted @ 2021-06-28 15:16 老酱 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 第四章 4.1 读写不同数据源的数据 4.1.1 读/写数据库数据 数据库 数据读取: 注意:数据库的用户名(一般都是root)和密码(自己设置的)都是要用自己的,地址默认的127.0.0.1 读取函数(你自己把文件存在哪了?)和存储函数(你要把问价存在哪?)的路径,一定要区别开 先明确读取表与查询 阅读全文
posted @ 2021-06-28 15:15 老酱 阅读(506) 评论(0) 推荐(0) 编辑
摘要: **[ 《Python数据分析与挖掘实战》第六章案例代码总结与修改分析 ](https://blog.csdn.net/fy_1852003327/article/details/10659265) ** 一、实验目的 1.掌握拉格朗日插值算法进行缺失值处理的方法。 2.掌握LM神经网络和CART决 阅读全文
posted @ 2021-06-28 15:12 老酱 阅读(780) 评论(0) 推荐(0) 编辑
摘要: 本文是对《Python数据分析与挖掘实战》实战篇第二章——航空公司客户价值分析上机实验的记录。 实验目的为: 了解K-Means算法在客户价值分析实例中的应用。 利用Pandas快速实现数据Z-score(标准差)标准化以及用Scikit-Learn的聚类库实现K-Means聚类。 具体实验过程分为 阅读全文
posted @ 2021-06-28 15:11 老酱 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 本文是基于《Python数据分析与挖掘实战》的实战部分的第八章的数据——《中医证型关联规则挖掘》做的分析。 旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码。 主要有:1)将原始数据按照聚类结果进行标记类别 1 背景与目标分析 此项目旨在根据相关数据建模,获取中医证素与乳腺癌TNM分期之间 阅读全文
posted @ 2021-06-28 15:06 老酱 阅读(456) 评论(0) 推荐(0) 编辑
摘要: 分类与预测 主要分类与预测算法 回归分析 确定预测值与其他变量关系。线性、非线性、Logistic、岭回归、主成分回归等 决策树 自顶向下分类 人工神经网络 用神经网络表示输入与输出之间的关系 贝叶斯网络 又称信度网络,是不确定知识表达和推理领域最有效的理论模型之一 支持向量机 将低维非线性可分转化 阅读全文
posted @ 2021-06-28 15:03 老酱 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 1.数据质量分析 主要任务是检查原始数据中是否存在脏数据,包括缺失值,异常值,不一致值, 重复数据及特殊符号数据 缺失值 ,包括记录缺失和记录的某字段缺失等 产生原因:无法获取、遗漏、属性值不存在; 影响:有用信息缺乏、不确定性加重、不可靠 处理:删除、补全、不处理 异常值 ,不合常理的数据,剔除可 阅读全文
posted @ 2021-06-28 15:00 老酱 阅读(747) 评论(0) 推荐(0) 编辑
摘要: 第 3 章数据探索(重要) ** ** ** 数据质量分析 ** 是数据预处理的前提,是数据挖掘分析结论有效性和准确性的基础,其主要任务 ** 是检查原始数据中是否存在脏数据, ** 脏数据包括: 缺失值 异常值 不一致的值 重复数据及含有特殊符号(如 # 、¥、 * )的数据 本小节将主要对数据中 阅读全文
posted @ 2021-06-28 14:59 老酱 阅读(425) 评论(0) 推荐(0) 编辑
摘要: 本章是对应用系统负载和磁盘容量进行分析和预测,涉及到的数据为时间序列数据,因此最后是用ARMA模型去拟合。 本文主要包含以下部分: ARMA模型 平稳性检验 白噪声检验 Python实战 总结 ARMA模型 关于ARMA模型,具体可看 [ 时间序列中的ARMA模型 ](http://www.more 阅读全文
posted @ 2021-06-28 14:57 老酱 阅读(1327) 评论(0) 推荐(0) 编辑
摘要: 一、分析方法与过程 本次针对京东商城上的“美的”热水器的文本评论数据进行建模分析。本文进行基本的预处理、分词等操作后建立LDA主题模型,实现对文本评论数据的倾向性判断及信息挖掘分析。 (1)利用爬虫进行数据采集(由于最近较忙,爬虫代码等空了再附上,暂且先用书中提供的数据进行建模),原始文本评论数据为 阅读全文
posted @ 2021-06-28 14:56 老酱 阅读(881) 评论(0) 推荐(0) 编辑
摘要: 序 言 数据可视化是关于数据视觉表现形式的技术,这种数据的视觉表现形式被定义为以某种概要形式抽取出来的信息,目的是要直观地展现数据,让用户花费数小时甚至更久才能归纳的规律,转化成一眼就能读懂的可视化图表。 本书基于 Power BI 编写,详细介绍了Power BI的数据可视化功能,包括数据类型和运 阅读全文
posted @ 2021-06-28 14:44 老酱 阅读(136) 评论(0) 推荐(0) 编辑
摘要: 利用python进行数据分析 麦金尼 代码实测常见问题汇总 第1章 准备工作 IPython安装及使用: 开始菜单输入cmd进入命令行; 输入"pip install ipython"进行安装; 输入ipython进入IPython运行模式。 书中示例数据下载地址: [ https://github 阅读全文
posted @ 2021-06-28 14:43 老酱 阅读(1100) 评论(0) 推荐(0) 编辑
摘要: 《利用python进行数据分析.第三版》 第四章 Numpy 一、numpy的ndarray:一种多维数组对象 创建nadrray 属性: arr.nidm:维度 arr.shape:维度大小 arr.dtype:数值类型 表达规则: np.函数(列表或元祖) 1.np.array(列表或者元祖); 阅读全文
posted @ 2021-06-28 14:41 老酱 阅读(1295) 评论(0) 推荐(0) 编辑
摘要: 写在前面的话 你好,我是小一 又要开始新的系列了,这个系列保证你一定会喜欢 考虑到前面的系列都是基础内容,而且篇幅还不少 所以这个系列打算多来点实战项目,像今天这种的,先做他十几二十个再说。 至于源码都会分享出来,一般都会在文末,需要的同学自取 做一下必要的介绍: 小一使用的Python版本是3.8 阅读全文
posted @ 2021-06-28 14:39 老酱 阅读(1002) 评论(0) 推荐(0) 编辑
摘要: | ### 《从1开始数据分析师成长之路》学习笔记 | | | | - - 一、描述、概括、分析 | | - - 1. 描述 | | - 2. 概括 | | - 3. 分析 | | - 4. 小结: | | - 二、传统数据VS大数据 | | - - 1. 数据获取方式 | | - 2. 传统数据与 阅读全文
posted @ 2021-06-28 14:31 老酱 阅读(127) 评论(0) 推荐(0) 编辑
摘要: python—B站弹幕数据分析 1 背景 在视频网站上,一边看视频一边发弹幕已经是网友的习惯。B站就是其中一个比较出名的弹幕网站,许多年轻人都喜欢逛B站,看喜欢的动漫亦或某些UP主做的一些剪辑。本项目,就是对B站弹幕数据进行分析。选取分析的对象是B站上一部国漫《全职高手》。 2 环境的安装 本项目实 阅读全文
posted @ 2021-06-28 14:28 老酱 阅读(329) 评论(0) 推荐(0) 编辑
摘要: 美国的零售业采用数据分析的方法,能够判断并预测消费者的购物行为。本文以大型连锁超市Target为例,详述该企业如何获知女性消费者的身体状况,同时在适当的时机以适当的方式进行推销。当我们发现自己被别人了解的是如此之多的时候,这种现象的意义也就超过了商业本身。 译者+审校: jiangyh 、 [ 水犹 阅读全文
posted @ 2021-06-28 14:26 老酱 阅读(146) 评论(0) 推荐(0) 编辑