机器学习 概论
机器学习 概论
什么是机器学习
- 机器学习是一门多领域交叉的学科,包括但不限于计算机、数学、统计学。专门研究计算机或其他软硬件设备如何模拟或实现人类的学习行为,以获得新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
- 机器学习是人工智能研究的核心内容。在人工智能的各个分支中,都大量存在机器学习的应用。例如:“专家系统”、“自动推理”、“自然语言”、“模式识别”(模式:常见的规律的识别)、“计算机视觉”、“智能机器人”等领域。
- 应用机器学习技术到产品中,给用户带来“机器具备人类智能”的震撼体验。
- 人力成本上升,机器学习能降低企业成本。
- 第二次机器革命——以具备人类智能为核心价值的机器占主导地位
- 机器学习在数据挖掘里被大量使用,其机器内涵几乎通用,可以看做是同座山峰的不同侧面。
机器学习应用较多的领域
- 数据分析和数据挖掘:用机器学习实现一套工具、方法或程式,从现实世界的含量数据中提炼出有价值的知识、规则和模式。并把该成果应用到前台系统,辅助业务进行,例如:推荐、决策系统,精准识别,参与服务等。
- 图像和语音识别:语音输入、OCR、手写输入、通讯监控、车牌识别、指纹识别、虹膜识别、人脸识别等。
- 智慧机器,机器人:生产线机器人,人机对话,电脑博弈。
- 文本挖掘:垃圾邮件过滤、新闻爬取、评论分析(贝叶斯分类器)。
软件
R、Weka、Matlab、Python
具有代表性的算法
- 回归预测及相应的降维技术:线性回归,Logistic回归,主成分分析,因子分析,岭回归,LASSO
- 分类器:决策树,朴素贝叶斯,贝叶斯信念网络,支持向量机,提升分类器准确率的Adaboost和随机森林算法
- 聚类与孤立点判别
- 人工神经网络