04 2022 档案
摘要:深度学习依赖大量的数据,除了使用公开的数据集之外就是利用Python的爬虫技术自己收集和整理,爬虫的本质是利用代码模拟浏览器向网页发起请求,得到网站的相应进行分析从中获取想要爬取的数据,本例子利用代码在百度图片上搜索鲜花,将搜索到的图片保存到本地。 首先对百度图片搜索鲜花页面进行分析,图片是不断动态
阅读全文
摘要:随机数在程序中十分常见,通过Python实现随机数生成,并设计一个快速排序算法实现对随机生成的数进行排序 random库是Python的一个非常常用的内置标准库,可以产生各种分布的伪随机数(如果随机数生成的种子是相同的,则每次生成的随机数都是相同的)。 下面定义一个函数,实现在指定范围内生成n个整数
阅读全文
摘要:批量修改文件名是工作中常见的一个需要,比如有大量的数文件或者图像文件为了分类要修改文件名。 OS库是与操作系统相关的Python库,可以做比如获取系统环境变量,文件目录,执行系统命令等。 常用的方法: os.listdir(dir_path)传入一个文件夹路径,获取的文件夹下面的文件列表。 os.p
阅读全文
摘要:Jupyter Notebook是一个交互式编程环境,是开源web应用Python编程IDE。 点击New键,选择python3(python3环境), 将会添加新文件 创建notebook文件,出现cell单元格,每一个单元格作为一个整体,运行代码时也是一个单元格一个单元格进行,极大的方便调试。s
阅读全文
摘要:基本概念: 有监督学习,无监督学习,机器学习的分类,回归,什么情况过拟合,什么情况下欠拟合。 机器学习最常见的算法: K最近邻算法,线性模型,朴素贝叶斯,决策树,随机森林,SVMs,神经网络。 不同的算法在不同的数据集上的表现不同。 主要任务是:建模,模型参数调整 建模的基础:数据进行降维,聚类,算
阅读全文