Tensorflow--机器学习基础理论
机器学习基础认识
机器学习:利用计算机从历史数据中找出规律,并把这些规律用到对未来不确定场景的决策
概率论 数据统计
数据代替expert
离线机器学习 在线学习(电商,搜索)
机器学习典型应用
购物篮分析(啤酒+尿布)-- 关联规则
用户细分精准营销(手机卡分类)-- 聚类
垃圾邮箱 -- 朴素贝叶斯
信用卡欺诈 -- 决策树
互联网广告 -- ctr预估
推荐系统 -- 协同过滤
自然语言处理 -- 情感分析、实体识别
图像识别 深度学习
语音识别 个性化医疗 情感分析 人脸识别 自动驾驶 手势控制 视频内容识别 机器实时翻译
机器学习和数据分析不同点
数据特点:行为数据(海量数据 全量分析 noSQL分布式CAP) 交易数据(少量 采样分析)
解决的业务问题不同:预测未来 分析过去
技术手段不同:(数据驱动 自动进行知识发展 数据挖掘) (用户驱动 交互式分析)
主体参与者不同:计算机(数据质量 针对个体) 分析师(能力 针对高层)
机器学习算法分类1
有监督学习 -- 如分类算法、回归算法,已经打上标签
无监督学习 -- 如聚类算法,无标签
半监督学习(强化学习)
机器学习算法分类2
分类与回归
聚类
标注
机器学习算法分类3
生成模型:概率
判别模型
常见算法
解决问题框架
确定目标
业务需求
数据
特征工程
训练模型
定义模型
定义损失函数
优化算法
模型评估
交叉验证
效果评估