大数据是什么?

大数据入门

什么是大数据

大数据解决的主要问题:海量数据的存储和海量数据的计算

大数据的特点:

(数据量大)、(数据种类多)、(大海捞针-找出有价值的数据)、(数据增长速度快、处理速度快、获取数据的速度也快)、 (数据的准确性和可信赖度)
数量单位:B->K(千)->MB(兆)->G(吉)->T(太)->P(拍)->E(艾)->Z(泽)->Y(尧)->B(布)->N(诺)->D(刀)(转换都是1024)
个人计算机的数量级一般为TB,企业中数量级达到EB

大数据的应用场景:

  • 电商--通过对用户的浏览、点击行为进行大数据采集、分析,挖掘用户的深层喜好,也就是淘宝上的“猜你喜欢”
  • 传媒--对受众人群进行大数据分析,结合算法,对受众喜欢的进行交互推荐--千人千面:抖音、今日头条
  • 金融--理财投资,风险评估,推荐相应的投资理财
  • 交通--实时交通,估算一定时间内路段的车流量情况,合理进行道路规划;实施信号灯调度
  • 电信--智慧营业厅,对用户当前行为、偏好数据变化,按需分配
  • 安防--人脸识别,匹配、存储用户信息,分析甄别,预防犯罪、抓捕犯人
  • 医疗--智慧医疗,通过对海量病例大数据的存储,匹配、检索用户的饮食、行为习惯,搭建智慧医疗体系

大数据业务分析基本步骤:

明确分析目的和思路->数据收集->数据处理->数据分析->数据展现->报告撰写
数据收集:可以从数据库中、或者从网站上爬一些数据
数据处理:对收集到的是数据进行加工整理,形成适合数据分析的样式,包括:数据清洗、数据转化、数据提取、数据计算等方法
数据分析:用一些工具进行分析-Mysql、Hive、Hbase、redis等。。。
数据展示:可视化结果

posted @   二白--  阅读(277)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· AI技术革命,工作效率10个最佳AI工具
点击右上角即可分享
微信分享提示