摘要: 构造数据 import pandas as pd df = pd.DataFrame({'Country':['China','China', 'India', 'India', 'America', 'Japan', 'China', 'India'], 'Income':[10000, 1000 阅读全文
posted @ 2020-08-18 17:07 柒久酒 阅读(2570) 评论(0) 推荐(0) 编辑
摘要: index()函数用于从列表中找出某个位置第一个匹配项的索引位置。 list.index(x,start[,end]]) x--查找的对象 start--可选,查找的起始位置 end--可选,查找的结束位置 阅读全文
posted @ 2020-08-18 15:55 柒久酒 阅读(1099) 评论(0) 推荐(0) 编辑
摘要: 无监督分箱法: 等距划分、等频划分 等距分箱 从最小值到最大值之间,均分为 N 等份, 这样, 如果 A,B 为最小最大值, 则每个区间的长度为 W=(B−A)/N , 则区间边界值为A+W,A+2W,….A+(N−1)W 。这里只考虑边界,每个等份里面的实例数量可能不等。 等频分箱 区间的边界值要 阅读全文
posted @ 2020-08-18 15:07 柒久酒 阅读(8406) 评论(0) 推荐(0) 编辑