摘要:
if __name__ == '__main__': root_dir = ".py文件目录" dirs = os.listdir(root_dir) for file in dirs: file=root_dir+"\\"+file res=parseFile(file) 阅读全文
摘要:
sklearn已经提供了很多转换器,如果想自定义转换器,可以定义一个新的类并且实现其fit(),transform(),fit_transform()三个方法。 添加TransformerMixin作为基类,会直接得到fit_transform()方法; 添加BaseEstimator作为基类,可以 阅读全文
摘要:
获取所需数据集: 快速查看数据结构(属性、特征信息): 纯随机抽样,产生测试数据集,占完整数据集的20%: 纯随机抽样获取测试集会产生偏差。因为纯随机抽样过程没有考虑不同特征值的分布情况。此例中,要预测的房价平均值与数据集中的收入中位数这一特征值有很大的关系,所以,抽样应符合收入中位数的分布情况,即 阅读全文
摘要:
改成: 参考: pandas.plotting 阅读全文
摘要:
使用jupyter编程时,中英文逗号极其相似,不易检查出来,可以根据逗号所占的宽度辨别,中文逗号间隔大,英文逗号间隔小,例如: 上面一行代码中,alpha=0.4后面的那个逗号是中文逗号,间隔比其他逗号宽一些。 阅读全文
摘要:
Replace values where the condition is False. 替换数据集中不满足条件的值,默认替换为NaN,且不保存到数据集中。 输出的第一列是索引值。 变量a没有改变: 添加第二个参数,表示把不符合条件的值改为此参数值。 添加第三个参数,把更改保存到变量。 不添加inp 阅读全文
摘要:
当UI界面需要读取网络内容等耗时操作时,可以使用这个方法。 添加按钮的点击事件: 添加webReader方法: 阅读全文
摘要:
swingUI中,为了线程安全,使用timer类实现延迟。 以上程序实现了进度条循环每隔一秒增加20%。 不能使用thread.sleep(1000)来实现一秒的延迟。 阅读全文