随笔 - 384  文章 - 0  评论 - 35  阅读 - 142万
07 2020 档案
Task05:字典、集合和序列(3天)
摘要:目录 一、字典 1. 可变类型与不可变类型 2.字典的定义 3.创建和访问字典 4.字典的内置方法 正文 一、字典 1.可变类型与不可变类型 1 序列是以连续的整数为索引,与此不同的是,字典以"关键字"为索引,关键字可以是任意不可变类型,通常用字符串或数值。 2 字典是 Python 唯一的一个 映 阅读全文
posted @ 2020-07-31 20:59 小小喽啰 阅读(143) 评论(0) 推荐(0) 编辑
Task 4: 列表、元组和字符串(3天)
摘要:一、列表 1.列表的定义 2.列表的创建 3.向列表添加元素 4.删除列表中的元素 5.获取列表中的元素 6.列表的常用操作符 7.列表的其他方法 二、元组 1.创建和访问一个元组 2.更新和删除一个元组 3.元组相关的操作符 4.内置方法 5.解压元组 三、字符串 1.字符串的定义 2.字符串的切 阅读全文
posted @ 2020-07-27 15:44 小小喽啰 阅读(391) 评论(0) 推荐(0) 编辑
sns.distplot()用法
摘要:sns.distplot()集合了matplotlib的hist()于sns.kdeplot()功能,增了rugplot分布观测显示与理由scipy库fit拟合参数分布的新颖用途 #参数如下 sns.distplot(a, bins=None, hist=True, kde=True, rug=Fa 阅读全文
posted @ 2020-07-27 11:29 小小喽啰 阅读(63187) 评论(0) 推荐(6) 编辑
sns.kdeplot()核密度估计图
摘要:核密度估计是概率论上用来估计未知的密度函数,属于非参数检验,通过核密度估计图可以比较直观的看出样本数据本身的分布特征 #参数如下: sns.kdeplot(data,data2=None,shade=False,vertical=False,kernel='gau',bw='scott',grids 阅读全文
posted @ 2020-07-27 11:19 小小喽啰 阅读(20672) 评论(0) 推荐(3) 编辑
Matplotlib中的plt和ax画图的区别
摘要:有时候的们使用plt.plot(),有时候使用ax.plot(),这二者画图有区别吗 首先,来看看Matplotlib画图的具体构成: 如果将Matplotlib绘图和我们平常画画相类比,可以把figure想象成一张纸(一般被称之为画布),axes代表的则是纸中的一片区域 回到上面说的,plt.pl 阅读全文
posted @ 2020-07-27 10:49 小小喽啰 阅读(6278) 评论(0) 推荐(0) 编辑
Task 3: 异常处理(2天)
摘要:异常处理 目录 1.python 标准异常总结 2.python 标准警告总结 3.try_excpt 语句 4.try_except_finally 语句 5.try_except_else 语句 6.raise 语句 正文 本次学习任务真的太好了,很久之前就想整理一下各种报错到底是什么东西引起的 阅读全文
posted @ 2020-07-24 15:39 小小喽啰 阅读(232) 评论(0) 推荐(0) 编辑
Task 2: 条件循环结构(1天)
摘要:目录 一、条件循环 1.if 语句 2.if-else 语句 3.if-elif-else 语句 4.assert 关键字 二、循环语句 1.while 循环 2.while -else 循环 3.for 循环 4.for -else 循环 5.range()函数 6.enumerate() 函数 阅读全文
posted @ 2020-07-23 22:25 小小喽啰 阅读(244) 评论(0) 推荐(0) 编辑
sklearn.svm 支持向量机
摘要:一、基本概念 支持向量机(support vector machines, SVM)是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,间隔最大使它有别于感知机。SVM的的学习策略就是间隔最大化,可形式化为一个求解凸二次规划的问题,也等价于正则化的合页损失函数的最小化问题。SVM 阅读全文
posted @ 2020-07-23 16:48 小小喽啰 阅读(292) 评论(0) 推荐(0) 编辑
python 正则表达式用法
摘要:做数据清洗时,经常需要用到正则表达式替换等等 首先介绍一下元字符(匹配规则) . 匹配任意字符(不包括换行符) ^ 匹配开始位置,多行模式下匹配每一行的开始 $ 匹配结束位置,多行模式下匹配每一行的结束 * 匹配前一个元字符0到多次 + 匹配前一个元字符1到多次 ? 匹配前一个元字符0到1次 {m, 阅读全文
posted @ 2020-07-23 13:59 小小喽啰 阅读(410) 评论(0) 推荐(0) 编辑
pandas replace() 替换用法
摘要:2021.02.05补充 之前写的替换都是整个值,也即是说如果被替换值='asdfg',之前的只有值等于='asdfg',才可以被替换,但是我们很多时候是值想替换局部的,比如说‘深圳地区’,替换为‘深圳市’,那么就得先str,代码如下: main_copy['city']=main_copy['ci 阅读全文
posted @ 2020-07-22 18:38 小小喽啰 阅读(38872) 评论(0) 推荐(0) 编辑
sns.boxplot() ,df.plot.box(),df.boxplot()箱型图
摘要:箱形图(Box-plot): 又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。它能显示出一组数据的最大值、最小值、中位数及上下四分位数 做模型时,经常使用箱型图查看特征变量有没有异常值 一、sns.boxplot() #参数如下: seaborn.boxplot(x=Non 阅读全文
posted @ 2020-07-22 18:14 小小喽啰 阅读(9900) 评论(0) 推荐(0) 编辑
Task01:变量、运算符、数据类型及位运算(2天)
摘要:day1 变量、运算符与数据类型 目录 1.注释 2.运算符 3.变量和赋值 4.数据类型与转换 5.print()函数 6.练习 一、注释 单行注释:# 多行注释 :''' ''' 或者是 """ """ ,在单引号或者双引号之间的内容被注释,常用语多内容多行注释 print('hi') #hi 阅读全文
posted @ 2020-07-22 14:51 小小喽啰 阅读(205) 评论(0) 推荐(0) 编辑
sns.barplot() 画条形图
摘要:sns.barplot() :条形图主要展现的是每个矩形高度的数值变量的中心趋势的估计 条形图只显示平均值(或其他估计值) 注:countplot参数和barplot基本差不多,可以对比着记忆,有一点不同的是countplot中不能同时输入x和y,且countplot没有误差棒, 类别特征barpl 阅读全文
posted @ 2020-07-21 18:34 小小喽啰 阅读(23932) 评论(0) 推荐(1) 编辑
sns.heatmap() 热地图,包括传统的,下三角,重点(挖空)相关性性图
摘要:sns.heatmap() 热地图 我一般使用来画特征相关系数的图 seaborn.heatmap(data, vmin=None, vmax=None, cmap=None, center=None, robust=False, annot=None, fmt='.2g', annotkws=No 阅读全文
posted @ 2020-07-21 17:39 小小喽啰 阅读(15893) 评论(0) 推荐(1) 编辑
sns.countplot() 画条形图
摘要:sns.countplot() 用于类别特征的频数条形图,可以画类别特征和y值(y值特征也是类比的话)的条形图 sns.countplot(x=None, y=None, hue=None, data=None, order=None, hue_order=None, orient=None, co 阅读全文
posted @ 2020-07-21 16:20 小小喽啰 阅读(14751) 评论(0) 推荐(1) 编辑
plt.pie(),df.plot.pie() 画饼图
摘要:plt.pie() 可以实现画饼图 plt.pie(x, explode=None, labels=None, colors=('b', 'g', 'r', 'c', 'm', 'y', 'k', 'w'), autopct=None, pctdistance=0.6, shadow=False, 阅读全文
posted @ 2020-07-21 15:53 小小喽啰 阅读(4699) 评论(0) 推荐(1) 编辑
sklearn.preprocessing归一化标准化等
摘要:目录 sklearn.preprocessing StandardScaler,标准化,也叫z-score规范化 最小-最大规范化 正则化(normalize) one-hot编码 特征二值化 标签编码(Label encoding) sklearn.preprocessing 属于数据预处理阶段, 阅读全文
posted @ 2020-07-21 15:18 小小喽啰 阅读(3034) 评论(0) 推荐(0) 编辑
df[col].value_counts().plot.bar(),sns.countplot(df[col])类别特征画条形图
摘要:当我们分析特征时,类别特征该可视化怎么做 一、只画类别特征: 1.df[col].value_counts().plot.bar() 2.sns.countplot(df[col]) import numpy as np import pandas as pd import matplotlib.p 阅读全文
posted @ 2020-07-20 17:07 小小喽啰 阅读(2813) 评论(0) 推荐(0) 编辑
pd.get_dummies()独热编码和pd.factorize()的用法
摘要:离散特征的编码分为两种情况:1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3} 一、pd.get_dummies() 一种字符 阅读全文
posted @ 2020-07-20 10:53 小小喽啰 阅读(3506) 评论(0) 推荐(0) 编辑
电信用户流失数据分析
摘要:电信用户数据:https://www.datafountain.cn/dataSets/35/details# 将装有该字典的Excel表导入到python中 import pandas as pd dict_name=pd.read_excel('F:\\python\\电信用户数据\\电信用户数 阅读全文
posted @ 2020-07-17 16:14 小小喽啰 阅读(2287) 评论(0) 推荐(0) 编辑
pandas 的df.smaple()抽样函数
摘要:df.sample()就是抽样函数,参数如下: df.sample(n=None,frac=None,replace=Flase,weights=None,random_state=None,axis=None) 参数说明: n:就是样本量,如果不写,就是抽一条数据 frac:抽样比,就是样本量占全 阅读全文
posted @ 2020-07-17 14:57 小小喽啰 阅读(2157) 评论(0) 推荐(0) 编辑
python 的dict的append()?
摘要:看我下面这个表达,以为dict有append() #导入模块 import pandas as pd import numpy as np import xlrd #读Excel import xlwt #将内容写进Excel #打开excel文件1 workbook = xlrd.open_wor 阅读全文
posted @ 2020-07-17 14:10 小小喽啰 阅读(16640) 评论(1) 推荐(0) 编辑
python zip()的使用
摘要:zip()函数将可迭代的对象作为参数,将对象对应的元素打包成一个个元祖,然后返回由这些元祖组成的对象,我们可以使用list()转换成列表 如果各个迭代器的元素个数不一致,则返回列表长度和最小的对象相同,用*好操作符,可以将元祖解压为列表 1.两个或者多个list a=[1,2,3] b=[4,5,6 阅读全文
posted @ 2020-07-17 11:31 小小喽啰 阅读(947) 评论(0) 推荐(0) 编辑
pandas 的pd.cut() 和pd.qcut() 数据分箱
摘要:pd.cut() 是把一组数据按照一定bins分割成离散的区间,得到的数据是每个值的落到的区间,此函数对于从连续变量转换为离散变量也很有用 #参数如下: pd.cut(x, bins, right=True, labels=None, retbins=False, precision=3, incl 阅读全文
posted @ 2020-07-16 16:55 小小喽啰 阅读(4998) 评论(0) 推荐(0) 编辑
pandas 的groupby()
摘要:2022.10.08增加了25 个例子学会Pandas Groupby 操作! (qq.com) groupby() DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, s 阅读全文
posted @ 2020-07-16 15:00 小小喽啰 阅读(1010) 评论(0) 推荐(0) 编辑
pandas 的apply() 函数
摘要:pandas的apply函数是自动根据function遍历每一个数据,然后返回一个数据结构为Series的结果 DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds) 参数解释: 阅读全文
posted @ 2020-07-16 11:08 小小喽啰 阅读(4942) 评论(0) 推荐(0) 编辑
天池二手车_特征工程
摘要:前面已经做了类别和连续特征的分析,本文将针对特征工程进行 导入数据 import pandas as pd import numpy as np import matplotlib import matplotlib.pyplot as plt import seaborn as sns %matp 阅读全文
posted @ 2020-07-15 18:32 小小喽啰 阅读(533) 评论(0) 推荐(0) 编辑
numpy简单的笔记
摘要:1.生成numpy import numpy as np #1.array,里面需要是数组 np.array([[1,2,3],[2,3,4]]) np.array([(1,2,3),(1,3,4)]) #2.arange,np.arange(start,stop,step),和range用法基本相 阅读全文
posted @ 2020-07-15 17:27 小小喽啰 阅读(160) 评论(0) 推荐(0) 编辑
python 面向对象编程的@property
摘要:Python内置的@property装饰器就是负责把一个方法变成属性调用的 class Student(object): @property def score(self): return self._score @score.setter def score(self, value): if no 阅读全文
posted @ 2020-07-15 14:35 小小喽啰 阅读(138) 评论(0) 推荐(0) 编辑
python 面向对象编程的__slots__
摘要:同一个类下,不同实例定义的属性或者方法,其他实例如果没有定义是不能使用的 #定义一个类 class Student(object): pass #给类绑定一个实例 s=Student() #给实例绑定一个属性 s.name='Micheal' s.name #'Micheal' s1=Student 阅读全文
posted @ 2020-07-15 14:31 小小喽啰 阅读(120) 评论(0) 推荐(0) 编辑
python 的类
摘要:目录 1.类和实例 1.1类和实例的概念 1.2类的属性 1.3类的方法 1.4类的访问限制 2.继承和多态 2.1继承的概念 2.2多态 正文 一、类和实例 1.类(Class)和实例(Instance)的概念 类就是一个抽象的模板,而实例就是类的一个个具体的对象,如动物就是一个类,而猪、狗、鸡等 阅读全文
posted @ 2020-07-14 18:59 小小喽啰 阅读(529) 评论(0) 推荐(0) 编辑
python 的偏函数(Partial function)
摘要:关于偏函数这个知识点,廖雪峰老师官网说的比较简单,我就再参考了另外一个花里花俏的园子:https://www.cnblogs.com/sui776265233/p/9881628.html#_label0 先引出偏函数 #一个带有可变参数的sum函数 def sum(*args): s=0 for 阅读全文
posted @ 2020-07-14 17:21 小小喽啰 阅读(798) 评论(0) 推荐(0) 编辑
python 的装饰器(Decorator)
摘要:先看一个例子 #这个是一个闭包,闭包前面已经说了 def log(func): def wrapper(*args, **kw): print('call %s():' % func.__name__) return func(*args, **kw) return wrapper @log def 阅读全文
posted @ 2020-07-14 16:03 小小喽啰 阅读(220) 评论(0) 推荐(0) 编辑
python 的lambda匿名函数
摘要:先看一个例子 list(map(lambda x:x*x,[1,2,3,4,5])) 关键字lambda 表示匿名函数,冒号前面的x表示函数参数,冒号后面是表达式 匿名函数有个限制,就是只能有一个表达式,不用写return,返回值就是该表达式的结果 如果是判断表达式,则和filter配合使用,如果是 阅读全文
posted @ 2020-07-14 15:02 小小喽啰 阅读(273) 评论(0) 推荐(0) 编辑
python 的闭包
摘要:我们先来看一个函数 def lazy_sum(*args): def sum(): ax=0 for n in args: ax=ax+n return ax return sum #调用 f=lazy_sum(1,2,3,4,5) f #<function __main__.lazy_sum.<l 阅读全文
posted @ 2020-07-14 14:45 小小喽啰 阅读(126) 评论(0) 推荐(0) 编辑
python 的filter()函数 用于过滤掉一些不需要的
摘要:filter(): numerical_fea = list(data_train.select_dtypes(exclude=['object']).columns) category_fea = list(filter(lambda x: x not in numerical_fea,list( 阅读全文
posted @ 2020-07-14 14:15 小小喽啰 阅读(841) 评论(0) 推荐(0) 编辑
python 的map和reduce(高阶函数)
摘要:一、map() map()函数接受两个参数,一个是函数(f),一个是可迭代对象iterable ,map将传入的函数依次作用到序列的每个元素,并把结果作为新的迭代器iterator 返回 例如: def f(x): return(x*x) r=map(f,[1,2,3,4,5]) r #是一个迭代器 阅读全文
posted @ 2020-07-14 11:29 小小喽啰 阅读(393) 评论(0) 推荐(0) 编辑
python 的迭代器
摘要:总结: 1.凡是可作用于for循环的对象都是可迭代对象:Iterable 2.可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator 3.集合数据类型如list、dict、str等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对 阅读全文
posted @ 2020-07-14 10:41 小小喽啰 阅读(127) 评论(0) 推荐(0) 编辑
python 的生成器
摘要:生成器(generator) 在Python中,这种一边循环一边计算的机制,称为生成器 通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。 而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间 阅读全文
posted @ 2020-07-13 18:51 小小喽啰 阅读(181) 评论(0) 推荐(0) 编辑
python 的列表生成式
摘要:列表生成式结构 [x for x in range(1,10)] 既是在[]里面添加for循环 文章参考廖雪峰老师的网站:https://www.liaoxuefeng.com/wiki/1016959663602400/1017317609699776 #list生成方式 #1.list() li 阅读全文
posted @ 2020-07-13 18:27 小小喽啰 阅读(231) 评论(0) 推荐(0) 编辑
python的函数参数
摘要:python 的定义函数有多种参数(必选参数(也称位置参数)、默认参数、可变参数、关键字参数、命名关键字参数) 全文参考廖雪峰老师的网站https://www.liaoxuefeng.com/wiki/1016959663602400/1017261630425888 1.必须参数 这个就是最常见, 阅读全文
posted @ 2020-07-13 17:58 小小喽啰 阅读(329) 评论(0) 推荐(0) 编辑
sns.regplot()的用法
摘要:sns.regplot():绘图数据和线性回归模型拟合 #参数 seaborn.regplot(x, y, data=None, x_estimator=None, x_bins=None, x_ci='ci', scatter=True, fit_reg=True, ci=95, n_boot=1 阅读全文
posted @ 2020-07-13 15:19 小小喽啰 阅读(25144) 评论(0) 推荐(1) 编辑
pandas 的pd.melt() 将宽表变成长表
摘要:pd.melt() 什么时候用到,画图时候用到,又或者是统计数据时用到 将宽数据变成长数据 pd.melt(frame, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None) 参数说明 fr 阅读全文
posted @ 2020-07-13 14:29 小小喽啰 阅读(1664) 评论(0) 推荐(0) 编辑
天池_二手车交易价格预测数据分析
摘要:赛题数据链接 https://tianchi.aliyun.com/competition/entrance/231784/information 字典 FieldDescription SaleID 交易ID,唯一编码 name 汽车交易名称,已脱敏 regDate 汽车注册日期,例如201601 阅读全文
posted @ 2020-07-10 16:12 小小喽啰 阅读(5135) 评论(0) 推荐(0) 编辑
plt.figure() 和plt.subplot() 的用法
摘要:一、plt.figure(num=None, figsize=None, dpi=None, facecolor=None, edgecolor=None, frameon=True) 方便连续画几个图片 参数说明: 1.num:图像编码或者名称,数字是编码,字符串是名称 2.figsize:宽和高 阅读全文
posted @ 2020-07-10 15:22 小小喽啰 阅读(50913) 评论(0) 推荐(2) 编辑
Python %和format的用法
摘要:一、%的用法 1.整数的输出 #八进制oct %o print('%o' % 10) #12 #十进制dec %d print('%d' % 1) #10 #十六进制hex %x print('%x' % 1) #a 2.浮点型数据输出 # %f 默认保留6位小数 %.1f 保留1位小数 print 阅读全文
posted @ 2020-07-10 11:18 小小喽啰 阅读(966) 评论(0) 推荐(0) 编辑
matplotlib画图
摘要:import matplotlib.pyplot as plt import numpy as np x = np.linspace(0, 2 * np.pi, 50) y = np.sin(x) plt.plot(x, y) plt.show() #在一张图纸里绘制多个图形,一起跑就OK了,简简单 阅读全文
posted @ 2020-07-09 18:49 小小喽啰 阅读(198) 评论(0) 推荐(0) 编辑
pandas merge,append,join,concat数据之间连接
摘要:一般左右连接使用merge,join,上下连接使用concat,append 1.merge 如果是多条件 model_data = pd.merge( data_due_outliers_stand,data_due_merge_cate_stand,on=['apply_no','ref_id' 阅读全文
posted @ 2020-07-09 17:31 小小喽啰 阅读(445) 评论(0) 推荐(0) 编辑
pandas 的简单操作
摘要:# -*- coding: utf-8 -*- """ Created on Fri Apr 3 14:36:20 2020 @author: Admin """ #使用python进行数据清洗 import pandas as pd dates=pd.date_range('20130101',p 阅读全文
posted @ 2020-07-09 16:52 小小喽啰 阅读(425) 评论(0) 推荐(0) 编辑
sns.pairplot()
摘要:pairplot:pair是成对的意思,即是说这个用来展现变量两两之间的关系,线性、非线性、相关等等 使用鸢尾花数据画图 #两种导入方式,这次是直接从sklearn.datasets导入 import pandas as pd from sklearn import datasets import 阅读全文
posted @ 2020-07-09 16:35 小小喽啰 阅读(16913) 评论(0) 推荐(3) 编辑
使用python处理Excel,Excel中一行数据生产一个Excel文件
摘要:应用场景:比如说收到一个文件,文件里面有几百个用户,需要按照一定的格式每一个用户生成一个Excel文件 需要生成这样结果: 每个文件格式如下: 代码如下: # -*- coding: utf-8 -*- """ Created on Tue Apr 28 15:16:14 2020 @author: 阅读全文
posted @ 2020-07-09 16:03 小小喽啰 阅读(1198) 评论(3) 推荐(1) 编辑
sklearn.model_selection
摘要:划分数据集方法: 留出法(train_test_split) 交叉验证法 KFold方法 k折交叉验证 RepeatedKFold p次k折交叉验证 LeaveOneOut 留一法 LeavePOut 留P法 ShuffleSplit 随机分配 自助法 一、留出法 留出法的想法很简单,将原始数据直接 阅读全文
posted @ 2020-07-09 15:48 小小喽啰 阅读(5094) 评论(0) 推荐(1) 编辑
sklearn.datasets
摘要:sklearn.datasets 1.波士顿房价数据 #波士顿房价数据集 from sklearn.datasets import load_boston import pandas as pd boston=load_boston() boston.data boston.target bosto 阅读全文
posted @ 2020-07-09 11:25 小小喽啰 阅读(513) 评论(0) 推荐(0) 编辑
sklearn.metrics 模型评估指标
摘要:一、分类指标 1.accuracy_score(y_true,y_pre):准确率 总的来说就是分类正确的样本占总样本个数的比例,数据越大越好, 但是有一个明显的缺陷,即是当不同类别样本的比例非常不均衡时,占比大的类别往往成为影响准确率的最主要因素,就会出现准确率很高,但是auc却很低的情况(样本不 阅读全文
posted @ 2020-07-08 17:06 小小喽啰 阅读(3524) 评论(0) 推荐(0) 编辑
LightGBM
摘要:LightGBM 属于boosting算法中的一种,全称为轻量的梯度提升机(Light Gradient Boosting Machine),由微软于2017年开源出来的一款SOTA Boosting算法框架。 跟XGBoost一样,LightGBM也是GBDT算法框架的一种工程实现,不过更加快速和 阅读全文
posted @ 2020-07-08 15:08 小小喽啰 阅读(1060) 评论(0) 推荐(0) 编辑
假设检验
摘要:假设检验 假设检验问题时统计推断中的一类重要问题,在总体的分布函数完全未知或只知其形式,不知其参数的情况,为了推断总体的某些未知特性,提出某些关于总体的假设,这类问题被称为假设检验 一个假设检验问题可以分为5步,无论细节如果变化,都一定会遵循这4个步骤 1.陈述研究假设,包含原假设(null hyp 阅读全文
posted @ 2020-07-07 17:11 小小喽啰 阅读(1106) 评论(0) 推荐(0) 编辑
常见的分布及如何使用python实现
摘要:常见分布有如下 独立同分布:independent and identically distributed, 简称i.i.d 即是说每个的试验结果都是相互独立,不收前后结果影响,且每一次事件A发生的概率都一样 一、连续型随机变量的常见分布 对于连续型随机变量,使用概率密度函数(probability 阅读全文
posted @ 2020-07-07 15:10 小小喽啰 阅读(4417) 评论(0) 推荐(0) 编辑
方差分析(Anova)
摘要:1.单因素方差分析: 单因素方差分析:只有一个因素A对实验指标有影响,假设因素A有r个水平,分别在第i个水平下进行多次独立的观察,所得到的实验指标数据如下: A1:N(μ1,σ2) X11 X12 ... X1n1 A2:N(μ2,σ2) X21 X22 ... X2n2 Ar:N(μr,σ2) X 阅读全文
posted @ 2020-07-07 11:33 小小喽啰 阅读(4838) 评论(0) 推荐(0) 编辑
numpy np.random生成随机数
摘要:1.生成指定形状0-1之间的随机数 :np.random.random()和np.random.rand() 注意:np.random.random()如果要生成多维数据时需要传入一个数组(tuple类型),而np.random.rand()可以直接传入 #生成0-1之间的随机数 import nu 阅读全文
posted @ 2020-07-06 18:54 小小喽啰 阅读(10719) 评论(0) 推荐(0) 编辑
python 泰坦尼克存活问题分析
摘要:导入基本的模块 #导入模块 import numpy as np import pandas as pd from scipy import stats import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline 阅读全文
posted @ 2020-07-06 15:08 小小喽啰 阅读(650) 评论(0) 推荐(0) 编辑
python 如何判断一组数据是否符合正态分布
摘要:正态分布 若随机变量x服从有个数学期望为μ,方差为σ2 的正态分布,记为N(μ,σ) 其中期望值决定密度函数的位置,标准差决定分布的幅度,当υ=0,σ=1 时的正态分布是标准正态分布 判断方法有画图/k-s检验 画图: #导入模块 import numpy as np import pandas a 阅读全文
posted @ 2020-07-06 11:30 小小喽啰 阅读(16783) 评论(0) 推荐(1) 编辑
python 实现汉诺塔
摘要:汉诺塔:汉诺塔(又称河内塔)问题是源于印度一个古老传说的益智玩具。大梵天创造世界的时候做了三根金刚石柱子,在一根柱子上从下往上按照大小顺序摞着64片黄金圆盘。 大梵天命令婆罗门把圆盘从下面开始按大小顺序重新摆放在另一根柱子上。并且规定,在小圆盘上不能放大圆盘,在三根柱子之间一次只能移动一个圆盘 py 阅读全文
posted @ 2020-07-06 10:50 小小喽啰 阅读(1246) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

点击右上角即可分享
微信分享提示