摘要:
由一个案例引出 房地产估价数据集数据集(house.xlsx) 数据集信息: 房地产估值的市场历史数据集来自台湾新北市新店区。“房地产估价” 是一个回归问题。 属性信息: 输入如下: X1 =交易日期(例如,2013.250 = 2013年3月,2013.500 = 2013年6月,等等) X2 = 阅读全文
摘要:
线性回归 回归问题的目标值是连续性的值,而分类问题的目标值是离散型的值。 回归处理的问题为预测: 预测房价 销售额的预测 设定贷款额度 总结:上述案例中,可以根据事物的相关特征预测出对应的结果值 线性回归在生活中的映射(现实生活中就有线性回归):生活案例【预测学生的期末成绩】: 期末成绩的制定:0. 阅读全文
摘要:
使用knn实现手写数字图片的识别 from sklearn.model_selection import cross_val_score import pandas as pd import numpy as np import matplotlib.pyplot as plt from sklea 阅读全文
摘要:
KNN分类模型 分类:将一个未知归类的样本归属到某一个已知的类群中 预测:可以根据数据的规律计算出一个未知的数据 概念: 简单地说,K-近邻算法采用测量不同特征值之间的距离方法进行分类(k-Nearest Neighbor,KNN) #两点间距离 A(x1,y1) B(x2,y2) dist(A,B 阅读全文
摘要:
sklearn的数据集 数据集划分 数据集接口介绍 数据集划分 前提:机器学习就是从数据中自动分析获得规律,并利用规律对未知数据进行预测。换句话说,我们的模型一定是要经过样本数据对其进行训练,才可以对未知数据进行预测的。 问题:我们得到数据后,是否将数据全部用来训练模型呢? 当然不是!因为我们如果模 阅读全文
摘要:
机器学习简介 祖师爷 艾伦.图灵,人工智能之父。其最大的成就就是图灵测试。一个人和一个机器跟你去聊天,你不知道对方是人还是机器,如果经过聊天后,你分辨不出谁是人谁是机器则说明这个机器通过了图灵测试 人工智能和机器学习的区别? 机器学习是实现人工智能的一种技术手段 什么是机器学习? 官方解释: 机器学 阅读全文
摘要:
第一部分:数据类型处理 数据加载 字段含义: user_id:用户ID order_dt:购买日期 order_product:购买产品的数量 order_amount:购买金额 观察数据 查看数据的数据类型 数据中是否存储在缺失值 将order_dt转换成时间类型 查看数据的统计描述 在源数据中添 阅读全文
摘要:
用户对于购买商品的行为分析案例 import pandas as pd from pandas import DataFrame,Series import numpy as np import matplotlib.pyplot as plt %matplotlib inline #数据量级达到一 阅读全文
摘要:
加载购买商品表的数据 购买商品表字段信息: 用户ID 商品ID 商品二级分类 商品一级分类 商品属性 购买数量 购买日期 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom pandas import Se 阅读全文
摘要:
plt.plot()绘制线性图 绘制单条线形图 绘制多条线形图 设置坐标系的比例plt.figure(figsize=(a,b)) 设置图例legend() 设置轴的标识 图例保存 fig = plt.figure() plt.plot(x,y) figure.savefig() 曲线的样式和风格( 阅读全文