摘要: 注:本文是《Mitchell机器学习》《JiaweiHan数据挖掘概念与技术》的学习笔记概览一1 ANN学习算法对于训练数据中的错误有非常好的健壮性,因此非常适合于这样的问题:训练集合为含有噪声的复杂传感器数据,例如来自摄像机和麦克风。2 ANN由一系列简单的单元相互密集连接构成,其中每个单元有一定数量的实值输入,并产生单一的实值输出。组成神经网络的几种主要单元包括:感知器,线性单元,sigmoid单元。3 感知器 I概念:输入实数值向量,计算其线性组合,结果大于某阈值输出1,否则输出-1。如下公式:或者:其中-w0是阈值。 II表征能力:即n维实例空间(点空间)中的超平面,或所有可能的实数值 阅读全文
posted @ 2011-01-29 17:30 zhaoqian 阅读(4922) 评论(1) 推荐(0) 编辑
摘要: 注:本文是《Mitchell机器学习》《JiaweiHan数据挖掘概念与技术》的学习笔记概览一1 决策树就是实例属性值约束的合取的析取式。从树根到树叶的每一条路径对应一组属性测试的合取,树本身对应这些合取的析取。2 决策树建立时,使用统计测试来确定每一个实例属性单独分类训练样例的能力,在每个结点选取能最好地分类样例的属性,且从不回溯重新考虑以前的选择。因此,决策树学习是一个自顶向下的贪婪搜索算法。3 每一步都使用统计测试使决策树学习对错误有很好的健壮性。4 决策树学习的假设空间包含所有的决策树,它是关于现有属性的有限离散值函数的一个完整空间。每个有限离散值函数都可被表示为某个决策树。因此,决策 阅读全文
posted @ 2011-01-25 16:15 zhaoqian 阅读(9212) 评论(0) 推荐(0) 编辑
摘要: 注:本文是《Mitchell机器学习》学习笔记概览1 概念学习:给定某一类别的若干正例和反例,从中获得该类别的一般定义,这也是归纳的直观意义。由于类别的定义即是确定一个对象是否属于该类别的东西,因此它等价于推断一个布尔函数。2 假设空间存在一般到特殊序关系的自然结构,即偏序。假设就是一系列的限制,限制少或宽松的假设集包含限制多或严格的假设集。如同多项式函数包含线性函数一样。3概括地说,FIND-S寻找极大特殊假设是种假设空间的搜索策略,它从最特殊假设开始,随着训练样例的出现逐步泛化假设,使假设刚好包含已出现的样例。很显然,这种泛化是与样例的出现顺序相关的,不同的泛化路径会得到不同的假设,当然也 阅读全文
posted @ 2011-01-21 13:45 zhaoqian 阅读(885) 评论(0) 推荐(0) 编辑
摘要: 注:本文是《Mitchell机器学习 引言》学习笔记概览1 实践的幂定律:指出对于很大范围内的学习问题,人们的反应速度随着时间次数幂级提高。(所以过遍数是背G单词的王道,深有体会)2 学习的定义:某计算机程序在某类任务T上以度量P衡量的能力随着经验E而自我完善——通过经验提高能力的某类程序。这里涉及了三个因素:任务的种类,衡量任务提高的标准,经验的来源(1)任务的种类à要学习的知识的确切类型(目标函数)à对这个目标知识的表示(目标函数表示),对于西洋跳棋学习就是ChooseMove()或Valuation()。(2)标准和经验共同构成了学习机制(函数逼近算法)。在这里要注意学习的三种形式:施教 阅读全文
posted @ 2011-01-20 11:44 zhaoqian 阅读(1362) 评论(0) 推荐(0) 编辑
摘要: Outlines1. 致力于解决temporalrecommendation问题2. 引入的概念主要有两个,STG(session-based temporal graph)及IPF(injected preference fusion)。STG是个有向二分图G(U,S,I,E,w),其中U是user结点集,S是session节点集,I是item结点集,w:E-R表示一个由边到权重的非负映射函数。对于temporal recommendation,常常涉及的元组格式为user,item,time,本文将其拆分为user,item和session,item,并将session,i 阅读全文
posted @ 2011-01-19 16:35 zhaoqian 阅读(1074) 评论(0) 推荐(0) 编辑