12 2014 档案

摘要:在查询多个表时,我们经常会用“连接查询”。连接是关系数据库模型的主要特点,也是它区别于其它类型数据库管理系统的一个标志。什么是连接查询呢? 概念:根据两个表或多个表的列之间的关系,从这些表中查询数据。 目的:实现多个表查询操作。知道了连接查询的概念之后,什么时候用连接查询呢? 一般是用作关... 阅读全文
posted @ 2014-12-20 23:04 yyxayz 阅读(430) 评论(0) 推荐(0) 编辑
摘要:SAD(Sum of Absolute Difference)=SAE(Sum of Absolute Error)即绝对误差和SATD(Sum of Absolute Transformed Difference)即hadamard变换后再绝对值求和SSD(Sum of Squared Diffe... 阅读全文
posted @ 2014-12-11 23:07 yyxayz 阅读(3468) 评论(0) 推荐(0) 编辑
摘要:kaggle上近一段时间数据挖掘竞赛的获奖队伍的源代码,对掌握相应的数据挖掘技术很有帮助。这些代码和技术都是经过竞赛实际检验的,比很多华而不实的学术论文要接地气得多。学习和实践起来也更方便Kaggle Competition Past Solutions2 Replies[edit: last up... 阅读全文
posted @ 2014-12-11 15:30 yyxayz 阅读(805) 评论(0) 推荐(0) 编辑
摘要:linecache模块允许从任何文件里得到任何的行,并且使用缓存进行优化,常见的情况是从单个文件读取多行。linecache.getlines(filename)从名为filename的文件中得到全部内容,输出为列表格式,以文件每行为列表中的一个元素,并以linenum-1为元素在列表中的位置存储l... 阅读全文
posted @ 2014-12-10 21:22 yyxayz 阅读(711) 评论(0) 推荐(0) 编辑
摘要:import linecachefile=open('3_2.txt','r')linecount=len(file.readlines())linecache.getline('3_2.txt',linecount)这样做的过程中发现一个问题,因为我的脚本是循环读取3_2.txt文件,当3_2.t... 阅读全文
posted @ 2014-12-10 20:47 yyxayz 阅读(3851) 评论(0) 推荐(0) 编辑
摘要:1、均方根值(RMS)也称作为效值,它的计算方法是先平方、再平均、然后开方。2、均方根误差,它是观测值与真值偏差的平方和观测次数n比值的平方根,在实际测量中,观测次数n总是有限的,真值只能用最可信赖(最佳)值来代替.方根误差对一组测量中的特大或特小误差反映非常敏感,所以,均方根误差能够很好地反映出测... 阅读全文
posted @ 2014-12-08 16:24 yyxayz 阅读(2721) 评论(0) 推荐(0) 编辑
摘要:问:为什么要去均值?1、我认为归一化的表述并不太准确,按统计的一般说法,叫标准化。数据的标准化过程是减去均值并除以标准差。而归一化仅包含除以标准差的意思或者类似做法。2、做标准化的原因是:减去均值等同于坐标的移动,把原始数据点的重心移到和原点重合,这样利于很多表达,比如数据的协方差矩阵可以写成XX'... 阅读全文
posted @ 2014-12-07 23:32 yyxayz 阅读(973) 评论(0) 推荐(0) 编辑
摘要:在某站点搜索某关键词:例,在站点mahout.apache.org搜索关键字random forest。random forest site:http://mahout.apache.org 阅读全文
posted @ 2014-12-04 22:46 yyxayz 阅读(175) 评论(0) 推荐(0) 编辑
摘要:make命令常用的三个选项:1.-k:它的作用是让make命令在发现错误的时候仍然继续执行.我们可以利用这个选项在一次操作中发现未编译成功的源文件.2.-n:它的作用是让make命令输出将要执行的操作步骤,而不是真正执行这些操作.3.-f :它的作用是告诉make命令将哪个文件作为makefile文... 阅读全文
posted @ 2014-12-03 17:04 yyxayz 阅读(985) 评论(0) 推荐(0) 编辑
摘要:1.简介2.简单编译 2.1.预处理 2.2.编译为汇编代码(Compilation) 2.3.汇编(Assembly) 2.4.连接(Linking)3.多个程序文件的编译4.检错5.库文件连接 5.1.编译成可执行文件 5.2.链接 5.3.强制链接时使用静态链接库1简介GCC 的... 阅读全文
posted @ 2014-12-03 15:52 yyxayz 阅读(235) 评论(0) 推荐(0) 编辑
摘要:在x86平台32位系统,系统占用2GB地址空间,用户方式2GB。如果使用VS,链接程序开关/SACK或者/F可以设置线程堆栈大小,默认分配一个线程的堆栈大小是1MB,当CreateThread参数的StackSize大小与链接程序设置的不一致时,采用的方法是谁大用谁的,所以用4KB修改当然不会有... 阅读全文
posted @ 2014-12-03 09:38 yyxayz 阅读(4746) 评论(0) 推荐(1) 编辑
摘要:归并排序的实现.时间复杂度是O(nlgn),空间复杂度是O(n) + O(lgn). 1 #include 2 3 using namespace std; 4 5 void merge_array(int *, int, int, int); 6 void merge_sort(int *,... 阅读全文
posted @ 2014-12-02 14:54 yyxayz 阅读(164) 评论(0) 推荐(0) 编辑
摘要:直接选择排序:直接选择排序的作法是:第一趟扫描所有数据,选择其中最小的一个与第一个数据互换;第二趟从第二个数据开始向后扫描,选择最小的与第二个数据互换;依次进行下去,进行了(n-1)趟扫描以后就完成了整个排序过程。那 是不是稳定的呢,我们可以观察一次扫描中,要交换最小的一个与第一个数据,最小的这个我... 阅读全文
posted @ 2014-12-02 10:30 yyxayz 阅读(330) 评论(0) 推荐(0) 编辑