摘要:
甘肃政法大学AI协会成员博客 甘肃政法大学AI协会 简介:甘肃政法大学AI协会正式成立于2022年6月30日,是在院团委领导下,人工智能与大数据发展环境为前提的实践性学生社团,是面向全校同学科技创新类社团。旨在为学生提供良好的学习人工智能领域相关知识的学习环境,促进学生在相关领域的技术发展与技术创新 阅读全文
摘要:
Datawhale 2025 AI冬令营 +动手定制你的专属大模型 前言:大模型是指具有大规模参数和复杂计算结构的机器学习模型。它们通常拥有数百万到数十亿的参数,需要大量的数据和计算资源进行训练和推理。大模型在深度学习领域中占据重要地位,能够处理复杂的任务,如自然语言处理、计算机视觉和语音识别等 阅读全文
摘要:
title: 基于github和Hexo 搭建自己的博客 基于github和Hexo 搭建自己的博客 【摘要】该教程基于个人的虚拟机和个人的GitHub,过程会详细注明对应的安装包的版本。 1、搭建hexo环境 环境配置 本地虚拟机:ubuntu 20.4(也可以基于对应的服务器) Hexo搭建步骤 阅读全文
摘要:
飞桨PaddlePaddle的安装 MacOS 下的 PIP 安装 一、环境准备 1.1 如何查看您的环境 可以使用以下命令查看本机的操作系统和位数信息: uname -m && cat /etc/*release 确认需要安装 PaddlePaddle 的 Python 是您预期的位置,因为您计算 阅读全文
摘要:
第 10 章 使用pyecharts 进行数据展示 10.1 安装 pyecharts pyecharts 是一个用于生成 Echarts 图表的类库, Echarts 是百度开源的一个数据可视化JS 库。用 Echarts 生成的图可视化效果非常好,pyecharts 可以与 Python 进行对 阅读全文
摘要:
第 9章 数据分析案例:Python 岗位行情 9.1 数据爬取 (1)打开某招聘网站首页 https://www.lagou.com,选择“全国站”,在搜索栏输入 Python,单击“搜索”。 (2)滚动到底部可以看到只有 30 页。 (3)多次单击“下一页”,发现页面并没有全部刷新,猜测是 Aj 阅读全文
摘要:
第 8章 Python 爬虫框架 Scrapy(下) 8.1 Scrapy 对接 Selenium 有一种反爬虫策略就是通过 JS 动态加载数据,应对这种策略的两种方法如下: 分析 Ajax 请求,找出请求接口的相关规则,直接去请求接口获取数据。 使用 Selenium 模拟浏览器渲染后抓取 阅读全文
摘要:
第 7章 Python 爬虫框架 Scrapy(上) 编写爬虫可以看成行军打仗,基本的角色有两个:士兵和将军,士兵冲锋陷阵,而将军更多地是调兵遣将。框架就像一个将军,里面包含了爬虫的全部流程、异常处理和任务调度等。除了可以让我们少写一些烦琐的代码,学习框架还可以学到编程思想和提升编程能力。Pytho 阅读全文
摘要:
第 6章 Python 应对反爬虫策略 爬取一个网站的基本步骤 (1)分析请求:URL 规则、请求头规则、请求参数规则。 (2)模拟请求:通过 Requests 库或 urllib 库来模拟请求。 (3)解析数据:获取请求返回的结果,利用 lxml、Beautiful Soup 或正则表达式提取需 阅读全文
摘要:
第5章 用数据库存储数据 5.1 MySQL 数据库 用 CSV 和 Excel 存储数据有两个优点: 非开发人员也能看到数据,不需要额外的学习成本。 使用方便,数据存储在文件里,复制到其他设备上可以直接查看。 这种表格存储文件的形式适用于少量数据的情况,当记录很多、字段很多时,打开文件会非常慢,而 阅读全文
摘要:
第4章 用 CSV 和 Excel 存储数据 4.1 用 CSV 文件存储数据 CSV(Comma-Separated Values)其实就是纯文本,用逗号分隔值,可以分隔成多个单元格。CSV 文件除了可以用普通的文本编辑工具打开,还能用 Excel 打开,但 CSV 和 Excel 有以下不同: 阅读全文