摘要:
表 3.1 WEKA中用于学习方案的通用选项 选项 功能-t<训练文件>指定训练文件-T<测试文件> 指定测试文件。如果该选项为空,就在训练数据上进行交叉验证-c<类索引> 指定类属性的索引-s<随机数种子>指定用于交叉验证的随机数种子-x<折的数量>指定用于交叉验证的折的数量-m<成本矩阵文件>指定含有成本矩阵的文件-d<输出文件>指定模型的输出文件-l<输入文件> 指定模型的输入文件-o 只输出统计数据,不输出分类器-i 对含又两个类的问题输出信息检索统计数据-k 输出信息理论统计数据-p&l 阅读全文
摘要:
通常会把整个训练集分成两个部分:拿数据的约60-80%放入我们的训练集,用来生成模型;然后拿剩下的数据放入一个测试集,在模型生成后,立即用其来测试我们模型的准确性。那么这个额外的步骤为什么在此模型中如此重要呢?这个问题就是所谓的过拟合:如果我们提供过多数据用于模型创建,我们的模型虽然会被完美创建,但只针对的是该数据。请记住:我们想使用此模型来预测未来的未知数;我们不是想使用此模型来准确地预测我们已经知道的值。这就是为什么我们要创建一个测试集。在创建了模型后,我们要进行检查以确保我们所创建模型的准确性不会在测试集降低。这就保证了我们的模型会准确地预测出未来的未知值。修剪。修剪正如其名字所指,意思 阅读全文
摘要:
Java代码 数据挖掘中决策树C4.5预测算法实现(半成品,还要写规则后煎支及对非离散数据信息增益计算),下一篇博客讲原理数据挖掘中决策树C4.5预测算法实现(半成品,还要写规则后煎支及对非离散数据信息增益计算),下一篇博客讲原理Java代码 packageorg.struct.decisiontree; importjava.util.ArrayList; importjava.util.Arrays; importjava.util.List; importjava.util.TreeSet; /** *@authorLeon.Chen */publicclassDecisionTreeB 阅读全文
摘要:
http://blog.csdn.net/hackbuteer1/article/details/67868181、堆和栈的区别?答:1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。 2、堆区(heap) 一般由程序员分配释放, 若程序员不释放,程序结束时可能由OS回收 。注意它与数据结构中的堆是两回事,分配方式倒是类似于链表,呵呵。 3、栈是向下增长的,堆是向上增长的。(可以参考上一篇博客)下面是一个例子程序:view plaincopy to clipboardprint?//main.cpp inta=0;//全局初始化 阅读全文
摘要:
http://blog.csdn.net/hackbuteer1/article/details/67873541、在段页式存储管理中,其虚拟地址空间是()A、一维 B、二维 C、三维 D、层次答案:B2、采用( )不会产生内部碎片(“内零头”)A、分页式存储管理 B、分段式存储管理 C、固定分区式存储管理 D、段页式存储管理答案:B3、段页式管理每取一数据,要访问()次内存。A、1 B、2 C、3 D、4答案:C4、分段管理提供(B)维的地址结构。A、1 B、2 C、3 D、4二维逻辑地址:段号+段内地址分页与分段的主要区别:1)、段是信息的逻辑单位,它是根据用户的需要划分的,因此段对用户. 阅读全文