随笔分类 - 大数据
摘要:数据准备 要制作这样一份动态排行榜,我们需要知道各个国家2016年到2018年间的GDP才行。我从网上找到了一份这样的数据,我们可以先看下原始数据是什么样的。 前两列是国家名称和国家代码,后面就是每一年的GDP值了。 整理数据 有了这份数据,我们打开Power BI,选择从Excel导入数据,如下图
阅读全文
摘要:安装基础库 pip install html5lib pip install pyecharts pip install matplotlib 安装地图库 pip install echarts-countries-pypkgpip install echarts-china-provinces-p
阅读全文
摘要:前言 腾讯网页数据有点变化,所以重新爬取了一下 基于pyecharts的可视化,这次更新新加了注释 数据源 腾讯疫情实时追踪 后期会继续更新pyecharts的绘图,搭建可视化大屏,感兴趣的可以先关注一下 源文件下载链接无需积分 第一部分 网页分析 今天重新整理了一下,发现数据结构和之前的有所变化,
阅读全文
摘要:写在前面 从今天开始的几篇文章,我将就国内目前比较主流的一些在线学习平台数据进行抓取,如果时间充足的情况下,会对他们进行一些简单的分析,好了,平台大概有51CTO学院,CSDN学院,网易云课堂,慕课网等平台,数据统一抓取到mongodb里面,如果对上述平台造成了困扰,请见谅,毕竟我就抓取那么一小会的
阅读全文
摘要:问题1:负号(减号)不能正常显示,显示为方框 问题2:不能显示中文 问题1:负号(减号)不能正常显示,显示为方框 问题2:不能显示中文
阅读全文
摘要:http://seaborn.pydata.org/generated/seaborn.barplot.html
阅读全文
摘要:# -*- coding: utf-8 -*- #1,基本统计分析 常用统计函数: size:计数,不需要括号 sum():求和 mean():均值 var():方差 std():标准差 import pandas as pd df = pd.read_excel(r'd:\rz.xlsx',she
阅读全文
摘要:一、字符串处理 二、正则表达式 \d匹配一个数字,\D匹配一个非数字,\w匹配一个字母或数字,.可以匹配任意一个字符,*表示任意字符,+表示至少一个字符 ?表示0个或1个字符,{n}表示n个字符,用{n,m}表示n~m个字符。 (1)\d{3} 表示匹配3个数字 (2)\s+ 表示至少匹配一个空格
阅读全文
摘要:Jupyter Notebook是一种Web应用,能让用户将说明文本、数学方程、代码和可视化内容全部组合到一个易于共享的文档中。本文例子都是在Jupyter Notebook上完成,Anaconda3自带该工具,直接点击打开。 启动后,在New下拉菜单中选择Python3,就会生成一个代码交互界面。
阅读全文
摘要:# -*- coding: utf-8 -*- #1, read_table()读取txt文件 from pandas import read_table df=read_table(r'D:\rz.txt',sep=" ") '''查看前3条数据,默认是5条''' print(df.head(3)) #2, read_csv()读取csv文件 from pandas import read_cs
阅读全文