答案均为转载,应怕原链接失效,所以粘贴了一下内容,答案尾部附上原链接

《南瓜书》https://github.com/datawhalechina/pumpkin-book/releases

第一章:绪论

答案1:

第一章
1.版本空间:
(1)色泽=青绿 根蒂=蜷缩 敲声=浊响
(2)色泽=青绿 根蒂=蜷缩 敲声=*
(3)色泽=青绿 根蒂=* 敲声=浊响
(4)色泽=* 根蒂=蜷缩 敲声=浊响
(5)色泽=青绿 根蒂=* 敲声=*
(6)色泽=* 根蒂=蜷缩 敲声=*
(7)色泽=* 根蒂=* 敲声=浊响
2.析合范式即多个合取式的析取。
表1.1包含3种属性,它的假设空间大小为3×4×4+1=49
考虑冗余情况:
具体假设 2×3×3=18种
一个属性泛化假设 2×3+3×3+2×3=21种
两个属性泛化假设 2+3+3=8种
三个属性泛化假设 1种
不考虑冗余、空集的情况下k最大取值为48,考虑冗余的情况下k最大取值为18
k=1时,共48种
k=18时,共1种
k取中间值,比较复杂。
3.(1)最简单的设计:训练样本一致特征越多越好,即一致性比例越高越好,为归纳偏好。考虑归纳偏好应尽量与问题相匹配,所以可使归纳偏好与噪声分布相匹配。
(2)通常认为两个数据的属性越相近,则更倾向于将他们分为同一类。若相同属性出现了两种不同的分类,则认为它属于与他最临近几个数据的属性。也可以考虑同时去掉所有具有相同属性而不同分类的数据,留下的数据就是没误差的数据,但是可能会丢失部分信息。
5.消息推送,如广告推荐;网站排名;图片搜索。
————————————————
版权声明:本文为CSDN博主「你--傻不傻」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_43260483/article/details/83750544

答案2:

https://blog.csdn.net/Weary_PJ/article/details/107238222?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-2&spm=1001.2101.3001.4242

答案3:  

此答案较为复杂,适合二刷时再看

https://blog.csdn.net/ytikewk/article/details/99745137

 

第二章:

答案一:

https://blog.csdn.net/u014134327/article/details/94603249?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522159593812819724811805582%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=159593812819724811805582&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~first_rank_ecpm_v3~pc_rank_v4-2-94603249.first_rank_ecpm_v3_pc_rank_v4&utm_term=%E8%A5%BF%E7%93%9C%E4%B9%A6%E7%AC%AC%E4%BA%8C%E7%AB%A0%E7%AD%94%E6%A1%88&spm=1018.2118.3001.4187

 

答案二:

https://blog.csdn.net/haiyu94/article/details/105890060?utm_medium=distribute.pc_relevant.none-task-blog-OPENSEARCH-5.channel_param&depth_1-utm_source=distribute.pc_relevant.none-task-blog-OPENSEARCH-5.channel_param