10 2019 档案

数据分析-04概率基础

摘要：一：随机事件概率：随机事件发生的可能性的度量范围：0 ~ 1 二：排列和组合 1.不重复的排列：从n个不同的元素中每次抽取m个不同的元素，按照一定的顺序排成一列，m<n 选排，m = n全排计算公式: P(n,n) = n! , p(m,n) = n(n-1)...(n-m+1) = n!/( 阅读全文

posted @ 2019-10-10 12:44 是四不是十阅读(339) 评论(0) 推荐(0) 编辑

数据分析-03数据分析

摘要：数据分析： 1.基本统计：describe() 常用的统计函数： size：计数 sum：求和 mean：均值 var：方差 std：标准差 2.分组分析：groupby() groupby(by=[分组列1，分组列2....])[统计列1，统计列2,...].agg({统计列别名1:统计函数;统计阅读全文

posted @ 2019-10-09 23:54 是四不是十阅读(142) 评论(0) 推荐(0) 编辑

数据分析-02数据可视化

摘要：数据可视化：模块（matplotlib） 1.散点图：plot()函数 plot(x,y,'.',color= (r,g,b)) plt.xlabel('x轴标签') plt.ylabel('y轴标签') plt.grid(True) plot参数说明：'.'、'o',小点还是大点 color，散点阅读全文

posted @ 2019-10-09 23:00 是四不是十阅读(91) 评论(0) 推荐(0) 编辑

数据分析-01数据处理

摘要：数据处理：(主要使用的模块为：pandas、numpy) 1.数据的存在形式：文件和数据库文件的存在形式分为：Csv(用，分割列的文本)，Excel，Txt （1）read_table导入文本文件 read_table(file,names=[列名]，sep="",encoding) names列阅读全文

posted @ 2019-10-09 01:00 是四不是十阅读(321) 评论(0) 推荐(0) 编辑

爬虫常用库

摘要：1.requests 2.selenium 3.lxml 4.beautiful soup 一般简单网站（对反爬虫没有特别严格），基本上就能使用requests.get(url)直接获取信息，些微麻烦点的需要加上user_agent，等等。那么此处就对反爬的一些策略进行分析。世界上没有一个网站能做阅读全文

posted @ 2019-10-08 11:27 是四不是十阅读(399) 评论(0) 推荐(0) 编辑

公告

昵称：是四不是十
园龄： 5年8个月
粉丝： 14
关注： 2

+加关注

2025年3月

日

一

二

三

四

五

六

是四不是十

10 2019 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

最新评论