上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 21 下一页
摘要: # coding:utf-8 """ logistic 回归, 自动建模 """ import pandas as pd # 参数初始化 filename = r"C:\learning\DataMining\Book\Python_DataMining\Data\chapter5\demo\dat 阅读全文
posted @ 2021-06-28 15:16 老酱 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 第四章 4.1 读写不同数据源的数据 4.1.1 读/写数据库数据 数据库 数据读取: 注意:数据库的用户名(一般都是root)和密码(自己设置的)都是要用自己的,地址默认的127.0.0.1 读取函数(你自己把文件存在哪了?)和存储函数(你要把问价存在哪?)的路径,一定要区别开 先明确读取表与查询 阅读全文
posted @ 2021-06-28 15:15 老酱 阅读(506) 评论(0) 推荐(0) 编辑
摘要: **[ 《Python数据分析与挖掘实战》第六章案例代码总结与修改分析 ](https://blog.csdn.net/fy_1852003327/article/details/10659265) ** 一、实验目的 1.掌握拉格朗日插值算法进行缺失值处理的方法。 2.掌握LM神经网络和CART决 阅读全文
posted @ 2021-06-28 15:12 老酱 阅读(780) 评论(0) 推荐(0) 编辑
摘要: 本文是对《Python数据分析与挖掘实战》实战篇第二章——航空公司客户价值分析上机实验的记录。 实验目的为: 了解K-Means算法在客户价值分析实例中的应用。 利用Pandas快速实现数据Z-score(标准差)标准化以及用Scikit-Learn的聚类库实现K-Means聚类。 具体实验过程分为 阅读全文
posted @ 2021-06-28 15:11 老酱 阅读(282) 评论(0) 推荐(0) 编辑
摘要: 本文是基于《Python数据分析与挖掘实战》的实战部分的第八章的数据——《中医证型关联规则挖掘》做的分析。 旨在补充原文中的细节代码,并给出文中涉及到的内容的完整代码。 主要有:1)将原始数据按照聚类结果进行标记类别 1 背景与目标分析 此项目旨在根据相关数据建模,获取中医证素与乳腺癌TNM分期之间 阅读全文
posted @ 2021-06-28 15:06 老酱 阅读(456) 评论(0) 推荐(0) 编辑
摘要: 分类与预测 主要分类与预测算法 回归分析 确定预测值与其他变量关系。线性、非线性、Logistic、岭回归、主成分回归等 决策树 自顶向下分类 人工神经网络 用神经网络表示输入与输出之间的关系 贝叶斯网络 又称信度网络,是不确定知识表达和推理领域最有效的理论模型之一 支持向量机 将低维非线性可分转化 阅读全文
posted @ 2021-06-28 15:03 老酱 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 1.数据质量分析 主要任务是检查原始数据中是否存在脏数据,包括缺失值,异常值,不一致值, 重复数据及特殊符号数据 缺失值 ,包括记录缺失和记录的某字段缺失等 产生原因:无法获取、遗漏、属性值不存在; 影响:有用信息缺乏、不确定性加重、不可靠 处理:删除、补全、不处理 异常值 ,不合常理的数据,剔除可 阅读全文
posted @ 2021-06-28 15:00 老酱 阅读(747) 评论(0) 推荐(0) 编辑
摘要: 第 3 章数据探索(重要) ** ** ** 数据质量分析 ** 是数据预处理的前提,是数据挖掘分析结论有效性和准确性的基础,其主要任务 ** 是检查原始数据中是否存在脏数据, ** 脏数据包括: 缺失值 异常值 不一致的值 重复数据及含有特殊符号(如 # 、¥、 * )的数据 本小节将主要对数据中 阅读全文
posted @ 2021-06-28 14:59 老酱 阅读(425) 评论(0) 推荐(0) 编辑
摘要: 本章是对应用系统负载和磁盘容量进行分析和预测,涉及到的数据为时间序列数据,因此最后是用ARMA模型去拟合。 本文主要包含以下部分: ARMA模型 平稳性检验 白噪声检验 Python实战 总结 ARMA模型 关于ARMA模型,具体可看 [ 时间序列中的ARMA模型 ](http://www.more 阅读全文
posted @ 2021-06-28 14:57 老酱 阅读(1327) 评论(0) 推荐(0) 编辑
摘要: 一、分析方法与过程 本次针对京东商城上的“美的”热水器的文本评论数据进行建模分析。本文进行基本的预处理、分词等操作后建立LDA主题模型,实现对文本评论数据的倾向性判断及信息挖掘分析。 (1)利用爬虫进行数据采集(由于最近较忙,爬虫代码等空了再附上,暂且先用书中提供的数据进行建模),原始文本评论数据为 阅读全文
posted @ 2021-06-28 14:56 老酱 阅读(881) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 21 下一页