淦丘比 - 博客园

2023年4月3日

摘要：本博客仅作为笔记，不做教学，教程可以看大佬这的flask教程。环境虚拟环境创建虚拟环境 Windows $ python -m venv env Linux 或 macOS $ python3 -m venv env 激活虚拟环境 Windows $ env\Scripts\activate 阅读全文

posted @ 2023-04-03 23:05 淦丘比阅读(14) 评论(0) 推荐(0) 编辑

2023年3月29日

git上传GitHub出现“fatal: The current branch master has no upstream branch.”的解决方法

摘要：一次跟着网站学习的时候，跟着提交本地仓库到GitHub，出现了如下错误。看了不少博客、文章，但一直没有找到个解决方法，最后好不容易才弄好了，于是写在这里，如果有大佬用上了的话，那可就太好了。好了，不扯淡了，我解决问题用了三步。在git bash中输入$ git pull origin mast 阅读全文

posted @ 2023-03-29 10:59 淦丘比阅读(163) 评论(0) 推荐(0) 编辑

2023年3月24日

HTML 文本处理基础

摘要： # 提前声明本博客只是将自己学到的知识做总结而已，细节学习请来[这里](https://developer.mozilla.org/zh-CN/docs/Learn/HTML/Introduction_to_HTML/HTML_text_fundamentals "这里")，大佬的教学很详细很棒。阅读全文

posted @ 2023-03-24 17:32 淦丘比阅读(5) 评论(0) 推荐(0) 编辑

2023年3月23日

HTML常用元素

摘要： [toc] # 元素大全 ``` ：定义HTML文档的根元素。：包含关于文档的元数据，如标题、样式表和脚本等。：定义文档的标题，通常出现在浏览器的标签栏中。：定义文档的主体，包含所有可见内容。 - ：定义标题，从大到小六级标题。：定义段落。：定义链接，可以链接到其他页面或同一页面内的锚点。阅读全文

posted @ 2023-03-23 21:38 淦丘比阅读(209) 评论(0) 推荐(0) 编辑

2023年3月6日

Python模拟登录

摘要：基于session和cookies 代码 import requests from urllib.parse import urljoin # 定义基础 URL 和登录、首页 URL BASE_URL = 'https://login2.scrape.center/' LOGIN_URL = url 阅读全文

posted @ 2023-03-06 14:13 淦丘比阅读(19) 评论(0) 推荐(0) 编辑

2023年3月1日

aiohttp 异步爬取实战

摘要： aiohttp库使用流程导入 aiohttp 库，并创建一个信号量，用于限制并发数量。定义索引页面和详情页面的URL，以及每页的大小和总页数。创建一个异步函数 scrape_api，用于爬取指定URL的数据。创建一个异步函数 scrape_index，用于爬取指定页码的索引数据。使用 as 阅读全文

posted @ 2023-03-01 19:27 淦丘比阅读(40) 评论(0) 推荐(0) 编辑

Ajax 数据爬取实例

摘要：大概流程在网页找目标Ajax 破解Ajax规律定义Ajax的URL，爬取Ajax的数据其实跟普通爬虫差别不大，只不过爬的对象从看到的网页变成了Ajax链接而已。只要找到Ajax链接，就可以很轻易的爬取下来了。全部代码 import requests import logging loggi 阅读全文

posted @ 2023-03-01 15:29 淦丘比阅读(33) 评论(0) 推荐(0) 编辑

2023年2月27日

大数据竞赛（高职组）

摘要：大数据平台环境搭建（10 分） Docker基本操作 Hadoop 完全分布式安装配置 Spark安装配置 Flink安装配置 Hive 安装配置 Kafka 安装配置 Flume 安装配置 ClickHouse 安装配置 HBase 安装配置总结基于Docker 环境，进行大数据相关平台阅读全文

posted @ 2023-02-27 22:48 淦丘比阅读(377) 评论(0) 推荐(0) 编辑

2023年2月14日

使用 Scrapy 框架的 Middleware

摘要：启用 Middleware 图中内容原本是注释的，去掉注释即可 'middlewares.'后面接的是middle类的名字，是可以改的。改成如图的形式就算启用指定名称的 middleware 了。函数详解这两个函数不用动，保持默认就好 def from_crawler(cls, crawler 阅读全文

posted @ 2023-02-14 22:57 淦丘比阅读(22) 评论(0) 推荐(0) 编辑

2023年2月13日

怎么使用 Scrapy 框架自带的 pipelines

摘要：定义一个 item 参数要设置为 file_urls 和 files 调用时 files 可以不写，有默认值 class PipelineFilepipelines(scrapy.Item): file_urls = scrapy.Field() files = scrapy.Field() 启用默阅读全文

posted @ 2023-02-13 15:27 淦丘比阅读(47) 评论(0) 推荐(0) 编辑

摆烂的revue

活着就是为了摆烂，向往自由的摆烂迎难而退，绝不逞强，能跑就跑我，再生产，要成为最没用的废物这就是我五彩斑斓的世界哒，丛雨酱

公告

摆烂的revue

活着就是为了摆烂，向往自由的摆烂 迎难而退，绝不逞强，能跑就跑 我，再生产，要成为最没用的废物 这就是我五彩斑斓的世界哒，丛雨酱

公告

活着就是为了摆烂，向往自由的摆烂迎难而退，绝不逞强，能跑就跑我，再生产，要成为最没用的废物这就是我五彩斑斓的世界哒，丛雨酱