随笔分类 - Python / python-数据分析
摘要:statsmodels 模块 简介: 用于拟合多种统计模型,执行统计测试以及数据探索和可视化 包含模型: 回归和线性模型 线性回归 广义线性模型 广义估计方程 广义加法模型 (GAM) 稳健的线性模型 线性混合效应模型 带离散因变量的回归 广义线性混合效应模型 方差分析 其他模型othermod
阅读全文
摘要:# -*- coding:utf-8 -*- import pandas as pd import numpy as np ### Resample # resample,重新采样,是对原样本重新处理的一个方法,是一个对常规时间序列数据重新采样和频率转换 index = pd.date_range(
阅读全文
摘要:statsmodels 模块 简介: 用于拟合多种统计模型,执行统计测试以及数据探索和可视化 包含模型: 回归和线性模型 线性回归 广义线性模型 广义估计方程 广义加法模型 (GAM) 稳健的线性模型 线性混合效应模型 带离散因变量的回归 广义线性混合效应模型 方差分析 其他模型othermod
阅读全文
摘要:matplotlib 一、Matplotlib基础知识 Matplotlib中的基本图表包括的元素 包含单条曲线的图 注意:y,x轴的值必须为数字 包含多个曲线的图 将多个曲线图绘制在一个table区域中:对象形式创建表图 坐标轴界限 坐标轴标签 图例 legend的参数 | 字符串 | 数值 |
阅读全文
摘要:散点图和KNN预测 一丶案例引入 二丶机器学习的概念 三丶k 近邻算法(KNN) k 近邻算法原理 欧几里得距离(Euclidean Distance) 案例一: 需求:预测年收入是否大于50K美元
阅读全文
摘要:pandas的操作 pandas的拼接操作 一丶pd.concat()级联 二丶pd.merge()合并 案例:人口分析 三丶数据处理 删除重复的元素 映射 四丶使用聚合操作对数据异常值检测和过滤 五丶排序 六丶 数据分类处理【重点】 分组 高级数据聚合 transform() 方法+自定义函数 t
阅读全文
摘要:数据分析三剑客之: Numpy 一丶Numpy的使用 numpy 是Python语言的一个扩展程序库,支持大维度的数组和矩阵运算.也支持针对数组运算提供大量的数学函数库 创建ndarray 使用np的routines函数创建 nadarray的属性 二丶ndarray的基本操作 索引 维与列
阅读全文