会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
麦小秋
记录学习历程!个人Q群:870467632(Python学习交流群)欢迎Python爱好者加入,一起学习,共同进步!
博客园
首页
新随笔
联系
订阅
管理
上一页
1
2
3
4
5
6
7
8
下一页
2020年1月22日
数据建模(1)-线性回归
摘要: 数据建模(1)-线性回归
阅读全文
posted @ 2020-01-22 22:25 麦小秋
阅读(144)
评论(0)
推荐(0)
编辑
数据特征分析(6)-相关性分析
摘要: 1.相关性分析 分析连续变量之间的线性相关程度的强弱 图示初判 / Pearson相关系数(皮尔逊相关系数) / Sperman秩相关系数(斯皮尔曼相关系数) # 图示初判 # (1)变量之间的线性相关性 data1 = pd.Series(np.random.rand(50)*100).sort_
阅读全文
posted @ 2020-01-22 22:24 麦小秋
阅读(475)
评论(0)
推荐(0)
编辑
2020年1月19日
网络爬虫(14)-动态页面爬取
摘要: 1.Ajax介绍 Ajax,全称为Asynchronous JavaScript and XML,即异步的JavaScript和XML。 它不是一门编程语言,而是利用JavaScript在保证页面不被刷新、页面链接不改变的情况下与服务器交换数据并更新部分网页的技术。发送Ajax请求到网页更新过程,简
阅读全文
posted @ 2020-01-19 23:23 麦小秋
阅读(1279)
评论(0)
推荐(0)
编辑
2020年1月16日
数据分析(6)-Pandas日期数据处理
摘要: Pandas 有着强大的日期数据处理功能,主要包括以下三个方面:按日期筛选数据、按日期显示数据、按日期统计数据 1、读取数据 import pandas as pd df = pd.read_csv('date.csv', header=None) print(df.head(2)) >>>输出结果
阅读全文
posted @ 2020-01-16 02:10 麦小秋
阅读(1695)
评论(0)
推荐(0)
编辑
2020年1月15日
mysql基础(2)-excel功能在excel中如何实现?
摘要: 1、vlookup功能: 2、对比两列差异 需求:对比sale的订单明细号与sale_guang订单明细号的差异 SELECT * from sale a WHERE a.ordernum not in (SELECT b.ordernum from sale_guang b); 3、去除重复值 需
阅读全文
posted @ 2020-01-15 17:52 麦小秋
阅读(384)
评论(0)
推荐(0)
编辑
2020年1月11日
数据分析(5)-数据可视化常用图表类型和使用场景
摘要: 1、柱状图 展示多个分类的数据变化和同类别各变量之间的比较情况。 适用:对比分类数据。局限:分类过多则无法展示数据特点。相似图表: 堆积柱状图。比较同类别各变量和不同类别变量总和差异。 百分比堆积柱状图。适合展示同类别的每个变量的比例。 2、条形图 类似柱状图。 适用:类别名称过长,将有大量空白位置
阅读全文
posted @ 2020-01-11 09:25 麦小秋
阅读(5587)
评论(0)
推荐(0)
编辑
2020年1月7日
财经数据(6)-Python多进程爬虫东方财富个股盘口异动数据
摘要: 1、先上个图看下网页版数据、mysql结构化数据 2、分析思路: 该网页主要采用动态加载来实现的,通过刷新页面查看URL,最终发现想要的数据,在js链接当中,进行头文件分析,构造URL,完成数据获取 数据存储方式上,尝试了Python单条读写mysql、利用Pandas构造DataFrame存储,2
阅读全文
posted @ 2020-01-07 22:50 麦小秋
阅读(2464)
评论(0)
推荐(0)
编辑
财经数据(5)-开盘啦股票标签数据爬虫
摘要: 本次主要是抓取开盘啦股票概念数据 采用多进程、requests完成数据的爬取 采用Pandas库完成数据比对,实现mysql数据存储 具体代码如下: # -*- coding: utf-8 -*- import pandas as pd import tushare as ts import tim
阅读全文
posted @ 2020-01-07 00:07 麦小秋
阅读(2775)
评论(2)
推荐(1)
编辑
2019年12月27日
财经数据(4)-Tushare金融接口数据获取
摘要: Tushare接口数据请求:分当天、历史两种情况。通过flag标签控制 由于部分接口请求限制,采用offset限制每次请求数量,time.sleep控制请求间隔时间 部分数据才用drop_duplicates(keep=False)去除所有重复数据 数据利用pandas写入mysql数据库。 数据表
阅读全文
posted @ 2019-12-27 17:48 麦小秋
阅读(858)
评论(0)
推荐(0)
编辑
2019年12月26日
财经数据(3)-金融可视化本地数据字典
摘要: stock_basic_data:股票列表 stk_code varchar(12) not null primary key unique 股票代码,有后缀symbol varchar(12) 股票代码,无后缀 stk_name varchar(30) 股票名称 city varchar(60)
阅读全文
posted @ 2019-12-26 20:24 麦小秋
阅读(664)
评论(0)
推荐(0)
编辑
上一页
1
2
3
4
5
6
7
8
下一页
公告