大数据是什么?
大数据入门
什么是大数据
大数据解决的主要问题:海量数据的存储和海量数据的计算
大数据的特点:
大(数据量大)、多(数据种类多)、值(大海捞针-找出有价值的数据)、快(数据增长速度快、处理速度快、获取数据的速度也快)、 信(数据的准确性和可信赖度)
数量单位:B->K(千)->MB(兆)->G(吉)->T(太)->P(拍)->E(艾)->Z(泽)->Y(尧)->B(布)->N(诺)->D(刀)(转换都是1024)
个人计算机的数量级一般为TB,企业中数量级达到EB
大数据的应用场景:
- 电商--通过对用户的浏览、点击行为进行大数据采集、分析,挖掘用户的深层喜好,也就是淘宝上的“猜你喜欢”
- 传媒--对受众人群进行大数据分析,结合算法,对受众喜欢的进行交互推荐--千人千面:抖音、今日头条
- 金融--理财投资,风险评估,推荐相应的投资理财
- 交通--实时交通,估算一定时间内路段的车流量情况,合理进行道路规划;实施信号灯调度
- 电信--智慧营业厅,对用户当前行为、偏好数据变化,按需分配
- 安防--人脸识别,匹配、存储用户信息,分析甄别,预防犯罪、抓捕犯人
- 医疗--智慧医疗,通过对海量病例大数据的存储,匹配、检索用户的饮食、行为习惯,搭建智慧医疗体系
大数据业务分析基本步骤:
明确分析目的和思路->数据收集->数据处理->数据分析->数据展现->报告撰写
数据收集:可以从数据库中、或者从网站上爬一些数据
数据处理:对收集到的是数据进行加工整理,形成适合数据分析的样式,包括:数据清洗、数据转化、数据提取、数据计算等方法
数据分析:用一些工具进行分析-Mysql、Hive、Hbase、redis等。。。
数据展示:可视化结果
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具