2022 年 4月随笔档案 - 老牛小茂

百度鲜花图像爬取

摘要：深度学习依赖大量的数据，除了使用公开的数据集之外就是利用Python的爬虫技术自己收集和整理，爬虫的本质是利用代码模拟浏览器向网页发起请求，得到网站的相应进行分析从中获取想要爬取的数据，本例子利用代码在百度图片上搜索鲜花，将搜索到的图片保存到本地。首先对百度图片搜索鲜花页面进行分析，图片是不断动态阅读全文

posted @ 2022-04-18 09:48 老牛小茂阅读(131) 评论(0) 推荐(0) 编辑

随机数生成与排序

摘要：随机数在程序中十分常见，通过Python实现随机数生成，并设计一个快速排序算法实现对随机生成的数进行排序 random库是Python的一个非常常用的内置标准库，可以产生各种分布的伪随机数（如果随机数生成的种子是相同的，则每次生成的随机数都是相同的）。下面定义一个函数，实现在指定范围内生成n个整数阅读全文

posted @ 2022-04-11 10:49 老牛小茂阅读(763) 评论(0) 推荐(0) 编辑

文件名批量修改

摘要：批量修改文件名是工作中常见的一个需要，比如有大量的数文件或者图像文件为了分类要修改文件名。 OS库是与操作系统相关的Python库，可以做比如获取系统环境变量，文件目录，执行系统命令等。常用的方法： os.listdir(dir_path)传入一个文件夹路径，获取的文件夹下面的文件列表。 os.p 阅读全文

posted @ 2022-04-11 09:45 老牛小茂阅读(316) 评论(0) 推荐(0) 编辑

jupyter notebook默认浏览器配置

摘要：Jupyter Notebook是一个交互式编程环境，是开源web应用Python编程IDE。点击New键，选择python3(python3环境), 将会添加新文件创建notebook文件，出现cell单元格，每一个单元格作为一个整体，运行代码时也是一个单元格一个单元格进行，极大的方便调试。s 阅读全文

posted @ 2022-04-09 15:57 老牛小茂阅读(242) 评论(0) 推荐(0) 编辑

机器学习的基本概念

摘要：基本概念：有监督学习，无监督学习，机器学习的分类，回归，什么情况过拟合，什么情况下欠拟合。机器学习最常见的算法： K最近邻算法，线性模型，朴素贝叶斯，决策树，随机森林，SVMs，神经网络。不同的算法在不同的数据集上的表现不同。主要任务是：建模，模型参数调整建模的基础：数据进行降维，聚类，算阅读全文

posted @ 2022-04-09 14:50 老牛小茂阅读(296) 评论(0) 推荐(0) 编辑

yeskey

04 2022 档案

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜