摘要:
PCA 即主成分分析技术,旨在利用降维的思想,把多指标转化为少数几个综合指标。 假设目前我们的数据特征为3,即数据维度为三,现在我们想将数据降维为二维,一维: 我们之前的数据其实就是三维空间中的一个个点,这些点漫布在空间中,如下图所示 将这些数据去掉一个维度,也就是说将这些数据映射到某一个平面上,可 阅读全文
摘要:
阅读全文
摘要:
求事件乘客等候不到5分钟乘上车的概率 汽车到达的时间点:7:15和7:30, 乘客等候不到5分钟乘车的条件为:7:10—7:15 或者 7:25—7:30 到达车站 事件所包含的样本点为:7:10—7:15 或者 7:25—7:30 两个时间段 总共的样本空间为:7:00—7:30 P = (5+5 阅读全文
摘要:
几何概型与古典概型的区别就是试验所有的可能性是否有限 阅读全文
摘要:
求事件n个人当中至少有2人生日同一天的概率,考虑其对立事件n个人当中没有人生日在同一天的概率会比较容易 n个人当中没有人生日在同一天,即第一个人的生日有365种选择,第二人有364种选择…… 事件包含的样本空间有 356*364*……*(365-n+1) 总的样本空间有 365**n 阅读全文
摘要:
第k位顾客中奖这个事件,意味着前k-1位顾客没有中奖,这个事件的完成需要k个步骤 第一步:第一个顾客从n-1张没奖的奖券中抽一张,共包含n-1个样本点 第二步:第二个顾客从n-2张没奖的奖券中抽一张,共包含n-2个样本点 …… 第k-1步:第k-1个顾客从n-k+1张没奖的奖券中抽一张,共包含n-k 阅读全文
摘要:
加法原理:做一件事情,完成它有n类方式,第一类方式有M1种方法,第二类方式有M2种方法,……,第n类方式有Mn种方法,那么完成这件事情共有M1+M2+……+Mn种方法。 乘法原理:做一件事,完成它需要分成n个步骤,做第一步有m1种不同的方法,做第二步有m2种不同的方法,……,做第n步有mn种不同的方 阅读全文
摘要:
1 import scrapy 2 import re 3 from fake_useragent import UserAgent 4 5 6 class DoubanSpider(scrapy.Spider): 7 name = "douban" 8 start_urls = ['https:/ 阅读全文
摘要:
爬虫的步骤:发送请求获得响应→解析并提取数据→保存数据 我们沿用这个朴素的逻辑去理解scrapy 一、发送请求获得响应 1、爬虫发送请求request到引擎 2、引擎将请求request传递给调度器scheduler队列 3、调度器scheduler从请求队列中向引擎输送request 4、引擎将r 阅读全文
摘要:
1 导入数据 合并数据 筛选字段 关闭并上载 阅读全文