摘要:
什么是机器学习? 广义概念: 机器学习是让计算机具有学习的能力,无需明确的编程 —— 亚瑟·萨缪尔,1959 工程概念: 计算机程序利用经验 E 学习任务 T,性能是 P,如果针对任务 T 的性能 P 随着经验 E 不断增长,则称为机器学习。 —— 汤姆·米切尔,1997 机器学习系统的类型 机器学 阅读全文
摘要:
1.通过pd.DataFrame新建数据框 2.通过df.iloc[]选择特定的列或对象 3.使用Pandas的isnull()判断值是否为空 4.使用all()和any()判断每列包含至少一个为Ture或全部为Ture的情况 5.使用pandas的dropna可以直接删除缺失值 6.使用SKlea 阅读全文
摘要:
import pandas as pd #生成重复数据 data1 = ['a',3] data2 = ['b',2] data3 = ['a',3] data4 = ['c',2] df = pd.DataFrame([data1,data2,data3,data4],columns=['col1','col2']) print(df) #判断重复数据 isDuplicated = df.d... 阅读全文
摘要:
使用Z标准化得到的阈值作为判断标准,标准化后的得分超过阈值则为正常: 阅读全文
摘要:
import pandas as pdimport numpy as npfrom sklearn.preprocessing import Imputer#生成缺失数据df = pd.DataFrame(np.random.randn(6,4),columns=['col1','col2','co 阅读全文
摘要:
python读取数据库基本方法: 阅读全文
摘要:
一、从文本文件中获取运营数据 1.使用read、readline、readlines读取数据 2、使用numpy的loadtxt、load、fromfile读取数据 (1)使用loadtxt方法读取数据文件 numpy可以读取txt格式的数据文件,数据通常是一维或者二维的。 (2)使用load方法读 阅读全文
摘要:
数据来源:https://pan.baidu.com/s/1a5kcBy0O0LGO8vo5SXI2Hw 第一步:导入库 第二步:导入数据 第三步:数据预处理 第四步:数据分析 第五步:数据建模 第六步:模型评估 第七步:销售预测 阅读全文