Alexander的Python机器学习 之目录分析。

 

无聊,顺应一下潮流,学习一下python机器学习吧。

买了一本书,首先分析一下目录吧。

 

1.第一章是 Python机器学习的生态系统。

  1.1.数据科学或机器学习的工作流程。

    然后又分成6点进行详细说明:获取,检查和探索,清理和准备,建模,评估,部署。

  1.2.讲解了Python库和相应的功能。

    这里也分成5个点进行详细说明:获取,检查,准备,建模和评估,部署。

  1.3.设置机器学习的环境。

  1.4.最后来一个总结。

 

2.第二章就来一个案例吧,构建应用程序,来挖掘低价的公寓。

  2.1.首先来获取公寓房源的数据吧。这里将使用import.io方法来抓取房源数据。

  2.2.然后就是检查和准备数据呢。分为两个点,首先分析数据,然后就是可视化数据。

  2.3.然后就是对数据进行建模。这里又分为两个点,首先是预测,然后就是扩展模型。

  2.4.最后来一个总结吧。

 

3.第三章来一个机票的案例吧,同样来挖掘一下低价的机票。

  3.1.首先肯定是要获取机票价格数据嘛。

  3.2.这里是一个学习点:使用高级的网络爬虫技术来检索票价数据。

  3.3.获取到数据之后就是解析了,这里通过聚类技术来识别一个异常的票价,也是一个学习点。

  3.4.然后就是意义所在之处了,通过使用IFTTT来发送实时提醒,这个就可以为人民服务了吧。

  3.5.学习了这些分散的知识点,通过这个项目简单整合一下吧。

  3.6.最后来一个总结吧。这个总结性价比极高的哟。

 

4.来点厉害的,使用逻辑回归来预测IPO市场,IPO市场就类似炒股了。

  4.1.首先介绍一下什么是IPO,这个不用说了,就是一些有商业头脑的人通过公众来投资公司攒大钱。

  4.2.讲解特征工程,这个厉害了。

  4.3.然后讲解二元分类,貌似很高大上呢。

  4.4.分析一下特征的重要性,同样也是预测IPO市场的重要部分吧。

  4.5.最后来个小结。

 

5.创建自定义的新闻源,这个我喜欢。

  5.1.使用Pocket应用程序,来创建一个监督训练的集合。原来训练就是这个意思,之前公司老是听到那些牛人说什么训练训练的。

  5.2.第二步就是获取到数据源了,这里使用embed.ly的API来下载故事的内容。

  5.3.然后就是讲解自然语言的一些处理基础了,这个是个难点。

  5.4.然后就是讲解如何使用向量机,这个同样非常关键,对于训练是非常有必要的。

  5.5.然后就是讲解IFTTT与文章源,Google表达和电子邮件的集成,这里涉及的概念有点多。

  5.6.然后就是根据自己爱好,设置每日个性化的简报,就是得出结果了吧。

  5.7.最后来一个小结吧。

 

6.来点有意思的东西,预测你的内容是否会广为流传。这个意思就是你火了。

  6.1.讲解了一个病毒的案例,说明它是怎么火的。

  6.2.统计火的程度,即获取分享的数量和内容。

  6.3.探索是怎么火起来的,即探索传播性的特征。

  6.4.然后就是构建一个自己的内容的预测模型,看看会不会火。

  6.5.最后来一个小结吧。

 

7.之前使用逻辑回归方法预测IPO市场,这里用机器学习来预测股票市场。

  7.1.首先要针对分析的类型研究一下,股票市场会有很多不同的类型嘛。

  7.2.然后就是我们能够从股票市场上学到一些东西,当然这是多方面的。

  7.3.这里动真刀了,教你如何开发一个交易策略。

    分为几个点吧,首先是延迟分析的周期,不然你分析完后时间已经过了,则得不偿失。

            然后是使用支持向量回归,来构建一个模型。

            最后来建模吧,再教你一个动态时间扭曲,这个名字nice啊。

  7.4.最后来一个小结咯。

  

8.再来一个案例吧,建立一个图片相似度的引擎。

  顾名思义,就是找到类似的图片。

  8.1.首先当然要了解一下图像的机器学习了。

  8.2.然后需要了解一下处理图像的知识。

  8.3.基础了解之后,来学一下如何查找相似的图像吧,这个当然是核心内容了。

  8.4.接下来就是了解深度学习了,这个应该就是深入学习图像之间的关系了。涉及到底层的操作。

  8.5.然后当然就是展示成果的引擎了,构建一个图像相似度的一个系统。

  8.6.最后来一个小结吧。

 

9.来一个聊天机器人吧。这个其实都耳熟能详了吧。

  9.1.首先了解一下图灵测试吧。这个最基础的东西了。

  9.2.然后就是了解一下聊天机器人历史和意义。

  9.3.开始进行设计了,要怎么实现,用什么方法,现在开始想啦。

  9.4.开始撸代码了,打造一个聊天机器人。

  9.5.最后来一个小结吧。

 

10.最后同样来一个有实际意义的功能,推荐引擎。

  现在大多新闻APP都基本实现按需分配了。

  10.1.首先是了解一下什么是协同过滤,这里分了两种,一种基于用户,一种基于项目的过滤。

  10.2.然后是了解一下什么是内容过滤,这个就是过滤的内在细节了。

  10.3.讲解一下什么是混合系统,将一种复杂的东西按照用户的需求来进行筛选的一个系统。

  10.4.开始撸代码了,打造一个推荐系统。

  10.5.最后来一个小结。

 

11.最最后,来一个个人总结。

  现在本人对Python和机器学习一窍不通。纯小白。

  看完这本书后,不知道又是怎样的一个我。开始漫长的机器学习之路吧。我爱robot。

  所以就第一章讲了一点基础,剩下的9章都是项目了,这样安排比较合理,我也很喜欢。

  项目才是推动知识的发展的根本。

 

posted @ 2018-06-07 22:17  Jason_Jan  阅读(411)  评论(0编辑  收藏  举报