摘要: 知识要点: 1、通过多项式曲线拟合引出线性模型; 2、介绍多项式的阶数与模型复杂度的关系; 3、什么是过拟合、欠拟合; 4、解决过拟合、欠拟合的方法; 5、最小化误差平方和可以使用最大似然估计解释,并且过拟合问题是最大似然估计的一个必然结果。 读书笔记: 上图中N=10个蓝色样本点是函数sin(2* 阅读全文
posted @ 2017-08-07 21:11 小明子 阅读(1287) 评论(0) 推荐(0) 编辑
摘要: bin(x): 英文说明:Convert an integer number to a binary string. The result is a valid Python expression. If x is not a Python int object, it has to define 阅读全文
posted @ 2017-04-14 14:46 小明子 阅读(1543) 评论(0) 推荐(0) 编辑
摘要: 1、对象的创建 java是面向对象的语言,因此对象的创建无时无刻都存在。在语言层面,使用new关键字即可创建出一个对象。但是在虚拟机中,对象创建的创建过程则是比较复杂的。 首先,虚拟机运到new指令时,会去常量池检查是否存在new指令中包含的参数,比如new People(),则虚拟机首先会去常量池 阅读全文
posted @ 2017-04-05 20:02 小明子 阅读(2983) 评论(0) 推荐(1) 编辑
摘要: 转载:http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.rename.html 阅读全文
posted @ 2017-03-30 18:16 小明子 阅读(42268) 评论(0) 推荐(0) 编辑
摘要: 声明:出处http://blog.csdn.net/zhongkejingwang/article/details/42264479 什么是PCA? 在数据挖掘或者图像处理等领域经常会用到主成分分析,这样做的好处是使要分析的数据的维度降低了,但是数据的主要信息还能保留下来,并且,这些变换后的维两两不 阅读全文
posted @ 2017-03-26 18:50 小明子 阅读(1730) 评论(0) 推荐(0) 编辑
摘要: 声明:转自http://blog.csdn.net/zhongkejingwang/article/details/43053513 在网上看到有很多文章介绍SVD的,讲的也都不错,但是感觉还是有需要补充的,特别是关于矩阵和映射之间的对应关系。前段时间看了国外的一篇文章,叫A Singularly 阅读全文
posted @ 2017-03-26 17:16 小明子 阅读(703) 评论(0) 推荐(0) 编辑
摘要: 一、引言 本文是总结斯坦福大学机器学习课程的第五次作业。作业分为两个部分,第一部分:根据水库的水位变化情况,要求使用正则化的线性回归预测大坝的出水量。第二部分:诊断调试机器学习算法和检查偏差和方差的影响。 作业,给出12个测试集数据,特征量只有一个x1反应的水库的水位情况,y是对应的大坝出水量。首先 阅读全文
posted @ 2017-03-13 20:35 小明子 阅读(866) 评论(0) 推荐(0) 编辑
摘要: 二叉搜索树 1、什么是二叉搜索数 对任何节点x,其左子树的关键字小于等于x.key,右子树的关键字大于等于x.key。 中序遍历可以算法可以按从小到大的顺序输出二叉搜索树的关键字。中序遍历代码如下: 中序遍历算法遍历一个含有n个节点的树,时间复杂度为Θ(n)。 作业 12.1-4 设计先序遍历算法和 阅读全文
posted @ 2017-03-06 20:25 小明子 阅读(438) 评论(0) 推荐(0) 编辑
摘要: 下面是对上面代码的说明: 下图是文件excel-comp-data.xlsx中的内容 使用head方法读取头部数据,对应代码中的df.head() 阅读全文
posted @ 2017-02-23 13:12 小明子 阅读(168) 评论(0) 推荐(0) 编辑
摘要: 1. 模型阐述 假设我们有下面的一组数据 对于上面的表格,我们可以找出其中的一个规律是: 输入的第一列和输出相同 那对于输入有3列,每列有0和1两个值,那可能的排列有\(2^3=8\)种,但是此处只有4种,那么在有限的数据情况下,我们应该怎么预测其他结果呢?这个时候神经网络就大显身手了! 如下图:输 阅读全文
posted @ 2017-02-22 19:52 小明子 阅读(816) 评论(0) 推荐(0) 编辑