初识Machine学习

机器学习定义:在没有明确设置的情况下,使计算机具有学习能力的研究领域

目前有各种不同的学习算法:最主要的两类是监督学习和无监督学习

监督学习:我们会教计算机做某件事情,然后在无监督学习中,我们让计算机自己学习

 

回归问题:我们想要预测连续的数值输出,我们设法预测连续值的属性

例如你有很多的货物,你要把卖的货物看成是一个连续的值,然后进行预测它的价格趋势,可以是一条直线,也可以是二次函数,拟合这个价格趋势

分类问题:目的是预测离散值输出(也是最常见的一种监督学习的方式)

例子:分类的话预测的值可能有很多种,比如0,1等进行分类,可能还有很多种情况,少量的离散值就可以作为分类问题

         分类问题

 

 

聚类算法:谷歌新闻所做的是去搜集成千上万条新闻,然后自动将他们分簇,有关同一个主题的新闻被显示在一起,这个就是聚类算法,用在组织大型的计算机集群

就是把不同的个体归入不同的类,这个就是无监督学习,我们没有提前告知这个算法,这个是归于那一类,这个是归于哪一类,相反的我们只是告诉算法,这里有一堆的数据,这个也是聚类算法,聚类算法也是无监督学习的一种。

无监督学习:我不知道这些数据是什么,我也不知道是什么类型,我甚至不知道有哪些类型,需要去自动找到这些数据的结构。虽然说事先我不知道有哪些类型,但是可以自动按得到的类型在把这些个体分成簇,事先是没有将数据集的答案给算法,这个就是无监督学习。

市场分割:找到不同的市场人群,分到不同的细分市场,从而能够自动高效地在不同的细分市场中进行销售,这也就是无监督学习。我们有全部的市场数据,但是预先是不知道有哪些细分市场,而且对于我们数据集中的客户,我们也不能知道谁是细分市场之一,我们必选让算法去自己去数据中发现一切。

                     聚类算法(无监督学习的一种)

 

鸡尾酒会算法:分离人声和音乐的声音

[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');一行代码将不同的音频分开,并且隔离

使用Octave的编程环境,Matlab也可以实现这些算法.最好不要使用C++,java,python等编程环境,使用Octave的编程环境可以更快的入手机器学习。

总的来讲无监督学习就是把数据交给算法让他自动进行处理

问答:

1.什么是机器学习呢?说白了就是告诉机器你想做什么,并且给它一堆的数据,让他模仿的去做(比如,上高中的时候,老师会告诉我们一个目标是考高分,然后给我们一堆练习题和答案,我们的目的就是让我们做的题的解和答案一致)

2.机器学习需要什么? 算法,数据,程序,评估(收尾阶段),应用

机器学习能做什么?机器学习在数据挖掘,统计学习,图像识别,语音和自然语言处理中有广泛的应用。

3.机器学习流程?

1.数据收集和预处理

2.特征选择(抽取)与模型构建(学习函数)

3.评估与预测

4.机器学习我该怎么学?机器学习本质上包含了数学原理推导与实际应用技巧。 

5.深度学习是什么?深度学习是机器学习中神经网络算法的延伸,只不过应用的比较广。深度学习在计算机视觉和自然语言处理中更厉害一些。

6.那我学机器学习还是深度学习?一切的基础都是机器学习,做任何事情没有坚实的基础只会越来越迷茫,机器学习觉得值得你从头开始。

posted @ 2019-05-03 05:57  风不再来  阅读(181)  评论(0编辑  收藏  举报