摘要: UTF-8就是集大成者编码。 阅读全文
posted @ 2019-04-12 22:55 月下林白 阅读(108) 评论(0) 推荐(0) 编辑
摘要: s.isalpha()意思就是是不是字母,s.isdigit()意思就是是不是0-9,s.isalnum()意思就是是不是由字母和数字组成。 阅读全文
posted @ 2019-04-12 19:45 月下林白 阅读(155) 评论(0) 推荐(0) 编辑
摘要: 终止条件就是进行直到划分为设置的聚类数 阅读全文
posted @ 2019-04-11 18:45 月下林白 阅读(109) 评论(0) 推荐(0) 编辑
摘要: https://www.cnblogs.com/pinard/p/6243025.html#undefined 阅读全文
posted @ 2019-04-10 20:25 月下林白 阅读(405) 评论(0) 推荐(0) 编辑
摘要: 构建的每一颗树的数据都是有放回的随机抽取的(也叫bootstrap),n_estimators参数是你想设置多少颗树,还有就是在进行树的结点分裂的时候,是随机选取一个特征子集,然后找到最佳的分裂标准。 阅读全文
posted @ 2019-04-04 17:26 月下林白 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-03-30 09:42 月下林白 阅读(421) 评论(0) 推荐(0) 编辑
摘要: 要根据不同的目标选取合适的评估指标。 进行二分类问题的时候,数据集之间的不平衡,会导致评价指标accuracy很高,但是却不能反应模型的好坏。 sklearn.metrics.confusion_matrix 如果标记数字的话,则按标签从小到大排序,如果为字符型的化,自己设计labels参数来表示其 阅读全文
posted @ 2019-03-30 09:42 月下林白 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-03-30 09:42 月下林白 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-03-30 09:42 月下林白 阅读(2609) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2019-03-30 09:41 月下林白 阅读(174) 评论(0) 推荐(0) 编辑