上一页 1 ··· 6 7 8 9 10 11 下一页
摘要: '\r'的本意是回到行首,'\n'的本意是换行。 所以回车相当于做的是'\r\n'或者'\n\r'。'\r'就是换行并回行首, '\n'就是换行并回行首,用'\r\n'表示换行并回行首。 windows的换行是\r\n,unix的是\n,mac的是\r。 阅读全文
posted @ 2018-10-30 09:56 时间带着假象流淌 阅读(17665) 评论(0) 推荐(1) 编辑
摘要: Pandas常用的数据清洗5大策略如下: 1.删除 DataFrame 中的不必要 columns 2.改变 DataFrame 的 index 3.使用 .str() 方法来清洗 columns 4.DataFrame.applymap() 函数按元素的清洗整个数据集 5.重命名 columns 阅读全文
posted @ 2018-10-29 22:03 时间带着假象流淌 阅读(449) 评论(0) 推荐(0) 编辑
摘要: 箱形图是数据集中数据分布情况的衡量标准。它将数据集分为三个四分位数。盒形图表示数据集中的最小值,最大值,中值,第一四分位数和第四四分位数。 通过为每个数据集绘制箱形图, 比较数据集中的数据分布也很有用。 R中的盒形图通过使用boxplot()函数来创建。 基本公式为: > A <- c(79.98, 阅读全文
posted @ 2018-10-29 11:05 时间带着假象流淌 阅读(3720) 评论(0) 推荐(0) 编辑
摘要: KNN简介 KNN(k-NearestNeighbor)算法的思想总结一下:就是在数据和标签已知的情况下,输入测试数据,将测试数据的特征与训练集中对应的特征进行相互比较,找到训练集中与之最为相似的前K个数据,则该测试数据对应的类别就是K个数据中出现次数最多的那个分类,其算法的描述为: 1.计算测试数 阅读全文
posted @ 2018-10-28 22:40 时间带着假象流淌 阅读(717) 评论(0) 推荐(0) 编辑
摘要: 均值是通过取数值的总和并除以数据序列中的值的数量来计算。 R语言平均值公式: > x<-c(-22,-13,2,45,56,73,21,44,NA)> result.mean<-mean(x,rim=0.2,na.rm=TRUE)#rim=0.2就是对x其中的向量排序,然后去掉左边和右边的各2个值, 阅读全文
posted @ 2018-10-19 17:24 时间带着假象流淌 阅读(5721) 评论(0) 推荐(0) 编辑
摘要: 主键:是唯一标识一条记录,不能有重复的,不允许为空,用来保证数据完整性 外键:是另一表的主键, 外键可以有重复的, 可以是空值,用来和其他表建立联系用的。所以说,如果谈到了外键,一定是至少涉及到两张表。 创建外键的方式: 方式一:表已经创建好了,继续修改表的结构来添加外键,代码如下: alter t 阅读全文
posted @ 2018-10-18 10:14 时间带着假象流淌 阅读(973) 评论(0) 推荐(0) 编辑
摘要: DataFrame是二维数据结构,即数据以行和列的表格方式排列!特点:潜在的列是不同的类型,大小可变,标记行和列,可以对列和行执行算数运算。 其中Name,Age即为对应的Columns,序号0,1,2,3,即为index pandas中的DataFrame构建函数格式:pandas.DataFra 阅读全文
posted @ 2018-10-09 15:52 时间带着假象流淌 阅读(854) 评论(0) 推荐(0) 编辑
摘要: 函数是通过赋值传递的,参数通过赋值传递给参数,def语句将创建的一个函数对象 并将其赋值给一个变量名! 函数定义的对象属局部作用域,只在函数内部有效,不会影响全局作用域中的对象! 赋值对象属于局部作用域,除非使用global关键字生命! 通过使用global函数影响全局变量a的值,代码如下: pyt 阅读全文
posted @ 2018-10-09 10:31 时间带着假象流淌 阅读(176) 评论(0) 推荐(0) 编辑
摘要: enumerate 函数用于遍历序列中的元素以及它们的下标: 阅读全文
posted @ 2018-10-08 15:08 时间带着假象流淌 阅读(264) 评论(0) 推荐(0) 编辑
摘要: 基本语法是通过 {} 和 : 来代替以前的 % 。 format 函数可以接受不限个参数,位置可以不按顺序。 直接打印输出参数: 通过字典设置参数: 通过列表索引设置参数: 阅读全文
posted @ 2018-10-07 14:26 时间带着假象流淌 阅读(594) 评论(0) 推荐(0) 编辑
上一页 1 ··· 6 7 8 9 10 11 下一页