10 2019 档案

摘要:一:随机事件 概率:随机事件发生的可能性的度量 范围:0 ~ 1 二:排列和组合 1.不重复的排列:从n个不同的元素中每次抽取m个不同的元素,按照一定的顺序排成一列,m<n 选排,m = n全排 计算公式: P(n,n) = n! , p(m,n) = n(n-1)...(n-m+1) = n!/( 阅读全文
posted @ 2019-10-10 12:44 是四不是十 阅读(339) 评论(0) 推荐(0) 编辑
摘要:数据分析: 1.基本统计:describe() 常用的统计函数: size:计数 sum:求和 mean:均值 var:方差 std:标准差 2.分组分析:groupby() groupby(by=[分组列1,分组列2....])[统计列1,统计列2,...].agg({统计列别名1:统计函数;统计 阅读全文
posted @ 2019-10-09 23:54 是四不是十 阅读(142) 评论(0) 推荐(0) 编辑
摘要:数据可视化:模块(matplotlib) 1.散点图:plot()函数 plot(x,y,'.',color= (r,g,b)) plt.xlabel('x轴标签') plt.ylabel('y轴标签') plt.grid(True) plot参数说明:'.'、'o',小点还是大点 color,散点 阅读全文
posted @ 2019-10-09 23:00 是四不是十 阅读(91) 评论(0) 推荐(0) 编辑
摘要:数据处理:(主要使用的模块为:pandas、numpy) 1.数据的存在形式:文件和数据库 文件的存在形式分为:Csv(用,分割列的文本),Excel,Txt (1)read_table导入文本文件 read_table(file,names=[列名],sep="",encoding) names列 阅读全文
posted @ 2019-10-09 01:00 是四不是十 阅读(321) 评论(0) 推荐(0) 编辑
摘要:1.requests 2.selenium 3.lxml 4.beautiful soup 一般简单网站(对反爬虫没有特别严格),基本上就能使用requests.get(url)直接获取信息,些微麻烦点的需要加上user_agent,等等。那么此处就对反爬的一些策略进行分析。 世界上没有一个网站能做 阅读全文
posted @ 2019-10-08 11:27 是四不是十 阅读(399) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示