了解大数据的特点、来源与数据呈现方式
作业来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2639
浏览2019春节各种大数据分析报告,例如:
- 这世间,再无第二个国家有能力承载如此庞大的人流量。http://www.sohu.com/a/290025769_313993
- 春节人口迁徙大数据报告!http://www.sohu.com/a/293854116_679156
- 春节大数据:消费首破万亿 最佳伴手礼竟是教辅书?
- http://news.163.com/19/0211/19/E7OPDBBU0001899N.html
- 大数据中的春节http://www.xinhuanet.com/politics/2019-02/13/c_1124110671.htm
- 春节年味大数据都有啥 90后年味就是抢红包http://news.zol.com.cn/708/7087625.html
- 春节大数据出炉
- http://www.sohu.com/a/223982938_100012490
- 2019年微信春节大数据:收发红包人数超8亿
- http://www.hnbstx.com/zixun/caijingzawen/20190212/124158.html
1.这些分析所采用数据的来源是什么?
(1).交易数据。如:POS机、信用卡刷卡、电子商务、互联网点击、微信支付、支付宝支付、银行卡转账等。
(2).移动通信数据。如:智能手机、移动通信设备等记录的数据。
(3).人为数据。如:电子邮件、文档、图片、音频、视频、微信、博客、脸书、微博等社交媒体。
(4).机器和传感器数据。如:感应器(智能温度控制器)、量表(智能电表)、定位/GPS系统数据(百度地图)和其他设施的数据等。
2.大数据的呈现方式有哪些?
(1)将指标数值化
(2)将指标图形化
(3)将指标关系图形化
(4)将时间和空间可视化
(5)将数据进行概念转换
3.大数据的特点是什么?对思维方式有何影响?
(1).数据量大:有大量的数据需要总结处理。
(2).要求快速响应:市场变化快,所以数据量对速度要求有些“大”。
(3).数据多样性:不同的数据源,非结构化数据越来越多,需要进行清洗,整理,筛选等操作。
(4).价值密度低:数据样本不全面数据可能会失真,可以通过更多的数据达到更真实全面的反馈。
4.准备python编程环境
下载安装
https://www.jetbrains.com/pycharm/download/#section=windows
基础学习
廖雪峰https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000
菜鸟教程http://www.runoob.com/python3/python3-tutorial.html
5.简单的输入输出编程练习
设计完成一个Mad Libs游戏:
1).创造一个让人欢乐的有趣的故事;
2).提示伙伴输入相应类别的词;
3).将故事完整地输出。