学习资源
Python基础到进阶合辑,你想要的Python知识都在这里--Python最全的文章、课程大合集,助你Python从初级到进阶,参与Python操作数据库、开发爬虫等实战,环环相扣,步步为营,你想要的Python的最全知识库全在这里!
1.【Python入门】:O课程-Python入门
2.【Python进阶】:O课程-python进阶
3.【Python开发简单爬虫】:O课程-Python开发简单爬虫
4.【Python操作MySQL数据库】:O网页链接
5.【Python正则表达式】:O课程-python正则表达式
6.【Python程序员经常犯的10个错误】:O网页链接
7.【八大排序算法的Python实现】:O网页链接
8.【我理解的Python最佳实践】:O网页链接
http://weibo.com/3306361973/DDQuSpkIg?type=comment#_rnd1468154826463
由莫烦Python录制的《tensorflow神经网络教程》和《Scikit-learn机器学习教程》视频公开在优酷上,《tensorflow神经网络教程》主要讲解什么是神经网络、tensorflow安装、tensorflow处理结构、Session会话控制、Variable变量、placeholder传入值、如何构建神经网络等22讲内容,详情请见链接1;《Scikit-learn机器学习教程》主要讲解什么是机器学习、Scikit-Learn安装、如何选择机器学习方法、sklearn的datasets数据库、model常用属性和功能等12讲内容,详情请见链接2。
链接1:
http://list.youku.com/albumlist/show?id=27327189&ascending=1&page=1
链接2:
http://list.youku.com/albumlist/show?id=27469882&ascending=1&page=1
更确切地说,用 20 个 Amazon EC2 机器实例,花费不到 580 美刀,在39小时25分钟,爬了250,113,669 个网页。文章对整个爬虫系统的架构做了详细的描述。虽是旧文,仍然值得借鉴。
I carried out this project because (among several other reasons) I wanted to understand what resources are required to crawl a small but non-trivial fraction of the web. In this post I describe some details of what I did. Of course, there’s nothing especially new: I wrote a vanilla (distributed) crawler, mostly to teach myself something about crawling and distributed computing. Still, I learned some lessons that may be of interest to a few others, and so in this post I describe what I did. The post also mixes in some personal working notes, for my own future reference.
链接:
http://www.michaelnielsen.org/ddi/how-to-crawl-a-quarter-billion-webpages-in-40-hours/
python机器学习指导,你在泰坦尼克号能幸免于难吗?Would You Survive the Titanic? A Guide to Machine Learning in Python,20分钟时间,你会学到如何用python使用不同的机器学习技术,从决策树到深度神经网络。从泰坦尼克旅客的性别、年龄信息中,预测出一个旅客幸免于难的概率。
链接:
https://medium.com/learning-new-stuff/would-you-survive-the-titanic-a-guide-to-machine-learning-in-python-f80c9d7b7582#.e49sgidat
SLAM技术随着最近几年机器人、VR、AR的火爆而为人所知,在传感器、算法、软件、硬件等方向都有不同的进展。本文简要解释了SLAM的定义和分类,具体分析了当前VR、AR、机器人等各种应用需要什么类别的SLAM,探讨了在实际应用中实现SLAM的一些工程细节,并展望了SLAM刚刚开始的未来。
什么是SLAM
SLAM是什么?根据Wikipedia的介绍:“Simultaneous Localization and Mapping (SLAM) is the computational problem of constructing or updating a map of an unknown environment while simultaneously keeping track of an agent’s location within it.”最简单而又直指本质的理解,SLAM指的是当某种设备(如机器人、VR设备等)来到一个完全陌生的环境时,它需要精准地建立时间和空间的对应关系,并能完美地回答以下一系列问题:我刚才在哪里,现在在哪里?我看到了什么,现在看到的和之前看到的有哪些异同?我过去的行走轨迹是什么?我现在看到的世界是什么样子,和过去相比有怎样的变化?我的轨迹抖吗,我的位置飘吗?我还能跟踪到自己的轨迹吗,如果我丢了应该怎么办?我过去建立的对世界的认识还有用吗?我能在已有世界的抽象里快速对我现在的位置进行定位吗?
原文链接:
http://ms.csdn.net/geek/86807?from=timeline&isappinstalled=0
什么是回归分析?
回归分析是一种预测性的建模技术,它研究的是因变量(目标)和自变量(预测器)之间的关系。这种技术通常用于预测分析,时间序列模型以及发现变量之间的因果关系。例如,司机的鲁莽驾驶与道路交通 事 故数量之间的关系,最好的研究方法就是回归。
回归分析是建模和分析数据的重要工具。在这里,我们使用曲线/线来拟合这些数据点,在这种方式下,从曲线或线到数据点的距离差异最小。我会在接下来的部分详细解释这一点。
链接:
http://dataunion.org/24963.html
如何用简单易懂的例子解释隐马尔可夫模型?
https://www.zhihu.com/question/20962240
深度学习有哪些好玩的且易于实现的论文?
https://www.zhihu.com/question/41231774
初学者TensorFlow教程和代码示例
这个Tensorflow教程包括Tensorflow基本运算,最近邻、线性回归、逻辑回归、多层感知器、CNN、RNN、LSTM等模型实现,已经教你如何保存模型、图可视化和多GPU运行等内容,此外还总结了计算机视觉和自然语言处理领域tensorflow实现的案例。
https://github.com/aymericdamien/TensorFlow-Examples
马尔可夫模型(Markov Model)是通过寻找事物状态的规律对未来事物状态进行预测的概率模型,在马尔可夫模型中假设当前事物的状态只与之前的n个状态有关。n=1时表示事物当前的状态只与上一个状态有关,这也是最简单的一阶马尔可夫模型。隐马尔科夫模型(Hidden Markov Model)是马尔可夫模型中的一种。马尔可夫模型的使用场景非常广泛,包括语言识别,自然语言处理和生物信息领域。Google的PageRank算法中也使用到了马尔可夫模型。
链接:
http://bluewhale.cc/2016-06-02/hidden-markov-model-1.html
常见的几种最优化方法
阅读目录
1. 梯度下降法(Gradient Descent)
2. 牛顿法和拟牛顿法(Newton's method & Quasi-Newton Methods)
3. 共轭梯度法(Conjugate Gradient)
4. 启发式优化方法
5. 解决约束优化问题——拉格朗日乘数
我们每个人都会在我们的生活或者工作中遇到各种各样的最优化问题,比如每个企业和个人都要考虑的一个问题“在一定成本下,如何使利润最大化”等。最优化方法是一种数学方法,它是研究在给定约束之下如何寻求某些因素(的量),以使某一(或某些)指标达到最优的一些学科的总称。随着学习的深入,博主越来越发现最优化方法的重要性,学习和工作中遇到的大多问题都可以建模成一种最优化模型进行求解,比如我们现在学习的机器学习算法,大部分的机器学习算法的本质都是建立优化模型,通过最优化方法对目标函数(或损失函数)进行优化,从而训练出最好的模型。常见的最优化方法有梯度下降法、牛顿法和拟牛顿法、共轭梯度法等等。
链接:
http://www.cnblogs.com/maybe2030/p/4751804.html
SVM的两大思想:大间隔与核函数
0.引言
上节讲到广义线性判别函数,它是从任意阶非线性判别函数到线性判别函数的一种有效变换,但是这种变换是以牺牲特征空间维数为代价的,如果能很好地处理这种维数灾难,那么上述变换也是极好的,有没有可能在特征空间上作变换呢,从而将原空间中的非线性问题转化为新空间中的线性问题,答案是肯定的,今天我们来学习如何构造这种非线性的支持向量机,因为它就是采用引入特征变化这一思路来实现的,但是值得注意的是,支持向量机并非直接计算这种复杂的非线性变换,而是采用了一种独特而又巧妙的迂回策略来间接实现的。
链接:
http://blog.csdn.net/eternity1118_/article/details/51660775
梯度下降法的三种形式BGD、SGD以及MBGD
阅读目录
1. 批量梯度下降法BGD
2. 随机梯度下降法SGD
3. 小批量梯度下降法MBGD
4. 总结
在应用机器学习算法时,我们通常采用梯度下降法来对采用的算法进行训练。其实,常用的梯度下降法还具体包含有三种不同的形式,它们也各自有着不同的优缺点。
本文以线性回归算法来对三种梯度下降法进行比较。
链接:
http://www.cnblogs.com/maybe2030/p/5089753.html