摘要:
训练阶段:从给定的训练数据集DB,构造一棵决策树 分类阶段:从根开始,按照决策树的分类属性往下划分,直到叶节点,获得概念(决策、分类)结果 特征选择 从定量的角度,信息增益与信息增益比就是表示特征“有效性”的指标。 信息熵是度量样本集合纯度最常用的一种指标。熵越大,不确定性越大;熵越小,不确定性越小 阅读全文
摘要:
支持向量机SVM是一种二分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类器,可将问题化为求解凸二次规划的问题。 在线性可分时,在原空间寻找两类样本的最优分类超平面。 在线性不可分时,加入松弛变量并通过使用非线性映射将低维输入空间的样本映射到高维空间使其变为线性可分。 决策面方程 如果输入 阅读全文
摘要:
回归算法是一种通过最小化预测值与实际结果值之间的差距,而得到输入特征之间的最佳组合方式的一类算法。对于连续值预测有线性回归等,而对于离散值/类别预测,我们也可以把逻辑回归等也视作回归算法的一种。 线性回归主要用来解决连续值预测的问题,逻辑回归用来解决分类的问题,输出的属于某个类别的概率,工业界经常会 阅读全文
摘要:
1.特征工程:数据预处理、特征选择、特征降维、特征构造
2.模型评估:过拟合与欠拟合
3.优化算法:正则化、梯度下降算法 阅读全文
摘要:
线程的生命周期 新建--运行--中断--死亡 线程的调度管理 线程的调度管理是由Java虚拟机的线程调度器负责 处理线程同步时,修改数据的方法要注意什么 两个或多个线程会同时访问同一个变量,并且一个线程需要修改这个变量。 第一件事就是把修改数据的方法用关键字synchronized修饰。 阅读全文
摘要:
Date类 import java.util.Date; Date nowTime=new Date(); Calendar类 import java.util.Calendar; Calendar calendar=Calendar.getInstance();//初始化一个日历对象 calend 阅读全文
摘要:
语法制导翻译 是以语法分析为主导的语义处理。语法分析过程中嵌入语义动作,即调用对应的语义子程序。 为每个文法规定相应的语义,即编写出相应语义处理子程序,整个分析是以语法分析为主导。 中间语言 逆波兰式(后缀表达式) 中缀转后缀表达式 赋值语句转后缀表达式 <左部>:=<表达式>,把赋值号“:=”看成 阅读全文
摘要:
自顶向下语法分析 消除回溯 路标法:设有规则U∷=a1V1|a2V2|…|anVn,若ai为互不相同的终结符时,将ai作为路标,当被分析符号串为ai时,便可按规则U∷=aiVi往下分析,这样可以消除回溯。 提取左因子法:当文法不满足上述路标法条件,即规则右部首符号相同时,可以采用提取左因子法对文法进 阅读全文
摘要:
基本概念 词法分析的作用:识别单词、消除无用字符、变成内部编码、建立各种表格、分配存贮单元(静态变量)、进行词法检查 单词:指那些具有独立含义的最小语法单位。(保留字、标识符、常数、运算符、界限符) 单词内部编码:单词类别|单词自身值 扫描缓冲区 当预处理子程序在处理一串确定长度的输入字符时,要将该 阅读全文
摘要:
巴科斯范式(BNF) 第一次提出是为了描述ALGOL语言。 以“::=”符号(或“→”符号)表示定义为,以“|”符号表示或,以“〈〉”符号表示语法实体(语法单位)。 形式语言基本概念和术语 元语言 用来描述其他语言的语言称为元语言,被描述的语言是对象语言。 用尖括号括起来的词汇就是元语言变量或语法单 阅读全文