上一页 1 2 3 4 5 6 7 8 9 ··· 23 下一页
摘要: 先搞单页网站: import requests from lxml import etree import re url = 'https://*********.com/top250?start=1' headers = { 'User-Agent': 'Mozilla/5.0 (Windows 阅读全文
posted @ 2024-01-22 18:57 Magiclala 阅读(13) 评论(0) 推荐(0) 编辑
摘要: 使用xpath方式,打印结果,经常出现大量换行、空格等情况 示例如下: from lxml import etree # data = etree.parse('./素材/示例网站.html') parser = etree.HTMLParser(encoding="utf-8") # 出现读取错误 阅读全文
posted @ 2024-01-22 18:15 Magiclala 阅读(605) 评论(0) 推荐(0) 编辑
摘要: 下载图片(单线程) import os.path import requests # 异步加载数据的接口 url = '************************************.com' headers = { 'User-Agent': '********************* 阅读全文
posted @ 2024-01-22 17:21 Magiclala 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 异步加载的特点 点击“查看更多”等按钮,浏览器“刷新”按钮无反馈效果。 查看浏览器点击F12的“DevTools”开发者工具,点选“网络”——“Fetch/XHR”——每点击一次“加载更多”就会出现一次网络请求 点击刷新出来的“请求内容”——点击“响应”,可以看到响应的是“字典” 点击标头,查看请求 阅读全文
posted @ 2024-01-22 15:51 Magiclala 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 网页同步加载的特点: 所见即所得:浏览器渲染后的展示字段,和“响应”页面中的“数据内容”、包括右键“查看源码”中完全一致。 同步请求的一般格式 import requests from lxml import etree # 同步加载的网站 url = '' headers = { 'User-Ag 阅读全文
posted @ 2024-01-22 15:36 Magiclala 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 这是标准的tr 、td格式 <table> <tr> <td>第一行第1列</td> <td>第一行第2列</td> <td>第一行第3列</td> </tr> <tr> <td>第二行第1列</td> <td>第二行第2列</td> <td>第二行第3列</td> </tr> <tr> <td>第 阅读全文
posted @ 2024-01-04 21:14 Magiclala 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 用with读取文件 # './素材/匹配天气.html'是文件路径,'r'表示读取模式,encoding='UTF-8'指定编码为UTF-8 with open('../素材/匹配天气.html', 'r', encoding='utf-8') as file: # 读取文件内容并将其保存在变量da 阅读全文
posted @ 2024-01-04 13:50 Magiclala 阅读(18) 评论(0) 推荐(0) 编辑
摘要: 1、安装 openssl-1.1.1 先处理下opensll的版本,以免编译安装Openssh环境异常: yum remove openssl cd /opt wget https://www.openssl.org/source/openssl-1.1.1n.tar.gz tar -zxvf op 阅读全文
posted @ 2023-12-27 15:41 Magiclala 阅读(2470) 评论(0) 推荐(0) 编辑
摘要: HTML中HEAD头部设置(了解) 在HTML中,<head> 元素是文档的头部部分,通常包含了一些关于文档的元信息和链接到外部资源的标签。以下是一些常见的 <head> 元素中使用的标签及其作用: <title>:设置网页的标题 设置网页的标题,显示在浏览器的标题栏或标签页上。 示例: <head 阅读全文
posted @ 2023-12-25 17:57 Magiclala 阅读(47) 评论(0) 推荐(0) 编辑
摘要: <iframe>(内联框架)是 HTML 中的一个标签,用于在当前文档中嵌入另一个文档。它提供了一种将一个 HTML 文档嵌套到另一个文档的方式,允许在一个页面中显示另一个页面的内容。以下是关于 <iframe> 的一些常见用法和意义: iframe本质就是引入,在页面中嵌入另一个页面。一般会用来嵌 阅读全文
posted @ 2023-12-25 16:41 Magiclala 阅读(81) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 ··· 23 下一页