2018年6月13日
摘要: 参数 estimator:数据对象 X:数据 y:预测数据 soring:调用的方法cv:交叉验证生成器或可迭代的次数 n_jobs:同时工作的cpu个数(-1代表全部)verbose:详细程度fit_params:传递给估计器的拟合方法的参数pre_dispatch:控制并行执行期间调度的作业数量 阅读全文
posted @ 2018-06-13 00:06 小学森也要学编程 阅读(30552) 评论(0) 推荐(0) 编辑
  2018年6月12日
摘要: 参数: n : int 数据集中的元素总数。 n_iter : int (default 10) 重新洗牌和分裂迭代次数。 test_size : float (default 0.1), int, or None 如果是float类型的数据, 这个数应该介于0-1.0之间,代表test集所占比例. 阅读全文
posted @ 2018-06-12 23:58 小学森也要学编程 阅读(1943) 评论(0) 推荐(0) 编辑
摘要: 参数 n_samples: int, optional (default=100) 待生成的样本的总数。 n_features: int, optional (default=2) 每个样本的特征数。 centers: int or array of shape [n_centers, n_feat 阅读全文
posted @ 2018-06-12 23:52 小学森也要学编程 阅读(700) 评论(0) 推荐(0) 编辑
摘要: 1.什么是随机森林 简述 随机森林是一个高度灵活的机器学习方法,拥有广泛的应用前景,从市场营销到医疗保健保险。 既可以用来做市场营销模拟的建模,统计客户来源,保留和流失。也可用来预测疾病的风险和病患者的易感性。 随机森林是一个可做能够回归和分类。 它具备处理大数据的特性,而且它有助于估计或变量是非常 阅读全文
posted @ 2018-06-12 23:47 小学森也要学编程 阅读(9525) 评论(0) 推荐(0) 编辑
摘要: python iris 数据集 sklearn中的iris数据集有5个key: [‘target_names’, ‘data’, ‘target’, ‘DESCR’, ‘feature_names’] target_names : 分类名称 [‘setosa’ ‘versicolor’ ‘virgi 阅读全文
posted @ 2018-06-12 21:19 小学森也要学编程 阅读(854) 评论(0) 推荐(0) 编辑
  2018年5月22日
摘要: 一、什么是字典? 字典是Python语言中唯一的映射类型。 映射类型对象里哈希值(键,key)和指向的对象(值,value)是一对多的的关系,通常被认为是可变的哈希表。 字典对象是可变的,它是一个容器类型,能存储任意个数的Python对象,其中也可包括其他容器类型。 字典类型与序列类型的区别: 1. 阅读全文
posted @ 2018-05-22 19:38 小学森也要学编程 阅读(1870) 评论(0) 推荐(0) 编辑
  2018年5月21日
摘要: 简介 有时候,我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现,我们要提取的网页元素并不在我们下载到的HTML之中,尽管它们在浏览器里看起来唾手可得。 这说明我们想要的元素是在我们的某些操作下通过js事件动态生成的。举个例子,我们在刷QQ空间或者微博评论的时候,一直往下刷,网页 阅读全文
posted @ 2018-05-21 23:39 小学森也要学编程 阅读(630) 评论(0) 推荐(0) 编辑
摘要: 简介 pyquery 可让你用 jQuery 的语法来对 xml 进行操作。这I和 jQuery 十分类似。如果利用 lxml,pyquery 对 xml 和 html 的处理将更快。 初始化 在这里介绍四种初始化方式。 (1)直接字符串 pq 参数可以直接传入 HTML 代码,doc 现在就相当于 阅读全文
posted @ 2018-05-21 15:54 小学森也要学编程 阅读(266) 评论(0) 推荐(0) 编辑
摘要: 简介 Selenium 是什么?一句话,自动化测试工具。它支持各种浏览器,包括 Chrome,Safari,Firefox 等主流界面式浏览器,如果你在这些浏览器里面安装一个 Selenium 的插件,那么便可以方便地实现Web界面的测试。换句话说叫 Selenium 支持这些浏览器驱动。 安装 首 阅读全文
posted @ 2018-05-21 15:31 小学森也要学编程 阅读(342) 评论(0) 推荐(0) 编辑
  2018年4月10日
摘要: #-*- coding:utf-8 -*- #取一个字符串中最多出现次数的词 import re from collections import Counter my_str = """ Simple is better than complex. Complex is better than complicated. Flat is better than nested. Sparse is... 阅读全文
posted @ 2018-04-10 20:32 小学森也要学编程 阅读(2428) 评论(0) 推荐(0) 编辑