08 2022 档案
摘要:机器学习 定义: 在没有明确设置的情况下,是计算机具有学习能力的研究领域 一个适当的学习问题定义如下,计算机程序从经验E中学习解决某一任务T进行某一性能度量P,通过P测定在T上的表现因经验E而提高 监督学习:我们给学习算法一个由“正确答案”组成的数据集,再根据这些样本做出预测。 无监督学习:(没有把
阅读全文
摘要:爬虫:通过编写程序,模拟浏览器上网,让其去互联网上抓取数据的过程 爬虫在使用场景中的分类: -通用爬虫:搜索引擎抓取系统的重要组成部分,抓取的是一整张页面的数据。 -聚焦爬虫:建立在通用爬虫的基础之上,抓取的是页面中特定的局部内容 -增量式爬虫:检测网站中数据更新的情况,只会抓取网站中最新更新出来的
阅读全文
摘要:虚拟机: 通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的完整计算机系统 在不破坏原有的操作系统的基础上,学习新的操作系统 Linux分为内核及发行版本 内核是系统的心脏,管理硬件设备 ;在内核内部由终端系统进行系统调用来管理硬件 发行版是将左面应用系统加上linux内核,发行版通过
阅读全文
摘要:面向对象和面向过程 类的组成 类属性 类中方法外的变量称为类属性,被该类的所有对象共享 Student.cm() #访问类属性 实例方法 静态方法 使用@staticmethod修饰的方法,使用类名直接访问的方法,Student.sm() #调用静态方法 类方法 使用@classmethod修饰的方
阅读全文