答案均为转载,应怕原链接失效,所以粘贴了一下内容,答案尾部附上原链接
《南瓜书》https://github.com/datawhalechina/pumpkin-book/releases
第一章:绪论
答案1:
第一章
1.版本空间:
(1)色泽=青绿 根蒂=蜷缩 敲声=浊响
(2)色泽=青绿 根蒂=蜷缩 敲声=*
(3)色泽=青绿 根蒂=* 敲声=浊响
(4)色泽=* 根蒂=蜷缩 敲声=浊响
(5)色泽=青绿 根蒂=* 敲声=*
(6)色泽=* 根蒂=蜷缩 敲声=*
(7)色泽=* 根蒂=* 敲声=浊响
2.析合范式即多个合取式的析取。
表1.1包含3种属性,它的假设空间大小为3×4×4+1=49
考虑冗余情况:
具体假设 2×3×3=18种
一个属性泛化假设 2×3+3×3+2×3=21种
两个属性泛化假设 2+3+3=8种
三个属性泛化假设 1种
不考虑冗余、空集的情况下k最大取值为48,考虑冗余的情况下k最大取值为18
k=1时,共48种
k=18时,共1种
k取中间值,比较复杂。
3.(1)最简单的设计:训练样本一致特征越多越好,即一致性比例越高越好,为归纳偏好。考虑归纳偏好应尽量与问题相匹配,所以可使归纳偏好与噪声分布相匹配。
(2)通常认为两个数据的属性越相近,则更倾向于将他们分为同一类。若相同属性出现了两种不同的分类,则认为它属于与他最临近几个数据的属性。也可以考虑同时去掉所有具有相同属性而不同分类的数据,留下的数据就是没误差的数据,但是可能会丢失部分信息。
5.消息推送,如广告推荐;网站排名;图片搜索。
————————————————
版权声明:本文为CSDN博主「你--傻不傻」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43260483/article/details/83750544
答案2:
答案3:
此答案较为复杂,适合二刷时再看
https://blog.csdn.net/ytikewk/article/details/99745137
第二章:
答案一:
答案二: