摘要:
在做东西的时候用到了社区发现,因此了解了一下有关社区发现的一些问题 1,社区发现算法 (1)SCAN:一种基于密度的社团发现算法 Paper: 《SCAN: A Structural Clustering Algorithm for Networks》 Auther: Xiaowei Xu, Nur 阅读全文
摘要:
拉格朗日乘子法:应用在求有约束条件的函数的极值问题上。 通常我们需要求解的最优化问题有如下几类: (i) 无约束优化问题,可以写为: min f(x); (ii) 有等式约束的优化问题,可以写为: min f(x), s.t. h_i(x) = 0; i =1, ..., n (iii) 有不等式约 阅读全文
摘要:
过拟合: Overfitting就是指Ein(在训练集上的错误率)变小,Eout(在整个数据集上的错误率)变大的过程 Underfitting是指Ein和Eout都变大的过程 从上边这个图中,虚线的左侧是underfitting,右侧是overfitting,发生overfitting的主要原因是: 阅读全文
摘要:
转自http://blog.csdn.net/sjkldjflakj/article/details/51886277 不同于以往的批量学习,即给了许多的已标记好的资料来学习出一个假设函数,online learning 的学习资料也就是样例是逐个到来了,边学习边修正自己的假设函数然后,给出答案 比 阅读全文
摘要:
(1)时间频度一个算法执行所耗费的时间,从理论上是不能算出来的,必须上机运行测试才能知道。但我们不可能也没有必要对每个算法都上机测试,只需知道哪个算法花费的时间多,哪个算法花费的时间少就可以了。并且一个算法花费的时间与算法中语句的执行次数成正比例,哪个算法中语句执行次数多,它花费时间就多。一个算法中 阅读全文
摘要:
线性回归是指,试图学得一个线性模型以尽可能准确的预测实值输出标记。 最小二乘法:基于均方误差最小化来进行模型求解的方法。 通过变成实现最小二乘法(可能不是最简化的,有待提高编程能力) 阅读全文
摘要:
转自http://www.cnblogs.com/huashiyiqike/p/3568922.html在学习算法的过程中,常常需要用到向量的求导。下边是向量的求导法则。 阅读全文
摘要:
StringBuffer就是字符串缓冲区,用于存储数据的容器。 特点:长度可变,可存储不同类型的数据,最终转化成字符串使用,可以对字符串修改 功能: 添加:append(value), insert(index,value); 删除:delete(start,end), deleteCharAt(i 阅读全文
摘要:
目的:为了方便操作基本数据类型值,将其封装为对象,在对象定义了属性和行为,丰富了改数据的操作,用于描述该对象的类也就成为基本数据类型对象包装类。 例如:int类型的取值范围:Integer >Integer.MAX_VALUE 8种数据类型包装类: byte ——Byte short ——Short 阅读全文
摘要:
一个线程是进程内的一个单一的顺序控制流程图,多线程是指一个进程可以同时运行几个任务,每个任务由一个线程来完成。即多个线程可以同时运行,并且在一个进程内执行不同的任务。 1.创建线程两种方法方法一, 继承自Thread: (1).定义一个类继承Thread类(2).覆盖Thread中的run()方法( 阅读全文