西瓜书第1章习题

1.1 试给出相应的版本空间。

首先有一个“假设空间”,现实问题中假设空间一般很大。然后有许多策略是可以对假设空间进行搜索,搜索过程中删除与正例不一致的假设、和反例一致的假设。最后选出来的假设的集合,就叫做“版本空间”

 

1.2 若使用最多包含k个合取式的析合范式来表达表1.1西瓜分类问题的假设空间,估算共有多少种可能的假设

至少看到色泽有2种取值、根蒂有3种取值、敲声有3种取值。可能的假设(“假设空间”的规模大小):3*4*4+1=49。

 

1.3 若数据包含噪声,则假设空间中有不存在与所有训练样本都一致的假设。在此情形下,试设计一种归纳偏好用于假设选择。

有多个假设,从已有的训练样本,无法判定哪个假设更好,但是我们必须要产生一个模型。就需要用到“归纳偏好”。更偏好“平滑”的曲线。

 

1.4* 不使用“分类错误率”而用新的性能度量来对分类器进行评估,试证明“没有免费的午餐定理”仍成立。

 

1.5 试述机器学习能在互联网搜索的哪个环节起什么作用。

用在搜索结果推荐。利用已有的某个用户的历史数据(如曾经搜索看过什么结果、用户设备信息等),猜测他可能对哪一条搜索结果感兴趣。感兴趣度应该是一系列的值,最后按照值的高度逆序排列。

posted @ 2018-06-09 21:21  ErinFlyingFish  阅读(506)  评论(0编辑  收藏  举报