2021 年 4月随笔档案 - {hunter}ZY

4.30线程和进程

摘要：python中实现多线程⾮常简单. 借助Thread类来完成. # 线程, 进程 # 进程是资源单位, 每一个进程至少要有一个线程 # 线程是执行单位 # 启动每一个程序默认都会有一个主线程 # def func(): # for i in range(1000): # print("func", 阅读全文

posted @ 2021-04-30 19:26 {hunter}ZY 阅读(35) 评论(0) 推荐(0) 编辑

4.28综合练习

摘要：综合练习，抓取⽹易云⾳乐评论信息，包括之前所有的学到的爬虫知识，代码： # 1. 找到未加密的参数 # window.arsea(参数, xxxx,xxx,xxx) # 2. 想办法把参数进行加密(必须参考网易的逻辑), params => encText, encSecKey => encSecK 阅读全文

posted @ 2021-04-28 18:41 {hunter}ZY 阅读(61) 评论(0) 推荐(0) 编辑

4.27防盗链和代理

摘要：抓取梨视频（防盗链） import requests url = "https://www.pearvideo.com/video_1713901" contId = url.split("_")[1] print(contId) videoStatus_url = f"https://www.pe 阅读全文

posted @ 2021-04-27 18:20 {hunter}ZY 阅读(58) 评论(0) 推荐(0) 编辑

4.26抓取猪⼋戒数据

摘要：xpath练习:抓取猪⼋戒数据 # 拿到页面源代码 # 提取和解析数据 import requests from lxml import etree url = "https://beijing.zbj.com/search/f/?type=new&kw=saas" resp = requests. 阅读全文

posted @ 2021-04-26 17:16 {hunter}ZY 阅读(57) 评论(0) 推荐(0) 编辑

团队项目第一阶段冲刺第四天

摘要：多少改了一些人家源码里的布局，大致就改成左边显示城市列表，右边显示两个柱状图，一个代表城市拥堵状况，一个代表区域拥堵状况。这是第一个界面。第二个界面相对而言就好写了一些，大致布局和第一个一样，就是右边显示的是中国地图，表示的是人口迁徙的状况。至此前端界面大致布局完成。阅读全文

posted @ 2021-04-25 21:10 {hunter}ZY 阅读(17) 评论(0) 推荐(0) 编辑

4.25xpath解析

摘要：xpath解析：XPath是一⻔在 XML 文档中查找信息的语言. XPath可用来在 XML文档中对元素和属性进行遍历. 而我们熟知的HTML恰巧属于XML的一个子集. 所以完全可以用xpath去查找html中的内容. 案例(注意：有的时候别人代码是直接引入etree，但我的会报错，解决方法就是引阅读全文

posted @ 2021-04-25 18:33 {hunter}ZY 阅读(39) 评论(0) 推荐(0) 编辑

4.24aiohttp模块学习

摘要：下载：pip install aiohttp 案例练习：爬取优美图库图片 # requests.get() 同步的代码 -> 异步操作aiohttp # pip install aiohttp import asyncio import aiohttp urls = [ "http://kr.sha 阅读全文

posted @ 2021-04-24 22:34 {hunter}ZY 阅读(97) 评论(0) 推荐(0) 编辑

团队项目第一阶段冲刺第三天

摘要：今天就要开始写前端展示的页面，这个我一直不太会写那些css样式还有HTML的布局，有些头皮发麻，，所幸之前在b站上找到了一个前端展示界面的教程，和我想要的效果挺像的，页面源码位置：C:\Users\Lenovo\Desktop\eckarts_open_class 自己写的进度代码路径：C:\Us 阅读全文

posted @ 2021-04-24 22:09 {hunter}ZY 阅读(19) 评论(0) 推荐(0) 编辑

团队项目第一阶段冲刺第二天

摘要：经过长时间思考和搜索，终于发现插不进去的原因是我的sql语句里面的数据名与mysql关键字重复....有点难受，就这卡了至少大几个小时。改了数据名之后也是成功插了进去，但有的表需要每次都更新，所以就在操作那些表的函数里的开头写了点代码让它每次执行先删除阅读全文

posted @ 2021-04-23 20:15 {hunter}ZY 阅读(21) 评论(0) 推荐(0) 编辑

团队项目第一阶段冲刺第一天

摘要：第一天今天是准备爬取高德大数据代码，主要爬取道路和区域拥堵数据，要按f12在network里面找存放当前时刻数据的文件，所有城市信息在https://trp.autonavi.com/ajax/getCityInfo.do?里面保存，道路信息在 https://trp.autonavi.com/a 阅读全文

posted @ 2021-04-22 21:04 {hunter}ZY 阅读(40) 评论(0) 推荐(0) 编辑

4.22

摘要：re练习⼿刃⾖瓣TOP250电影信息 import requests headers = { "user-agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) C 阅读全文

posted @ 2021-04-22 18:19 {hunter}ZY 阅读(42) 评论(0) 推荐(0) 编辑

4.21 re重要功能

摘要：re解析中比较重要的功能 1. findall 查找所有. 返回list lst = re.findall("m", "mai le fo len, mai ni mei!") print(lst) # ['m', 'm', 'm'] lst = re.findall(r"\d+", "5点之前. 阅读全文

posted @ 2021-04-21 18:06 {hunter}ZY 阅读(52) 评论(0) 推荐(0) 编辑

4.17

摘要：Python爬虫request模块首先安装：pip install requests 爬取搜狗尝试： # 案例1. 抓取搜狗搜索内容 kw = input("请输⼊你要搜索的内容:") response = requests.get(f"https://www.sogou.com/web?quer 阅读全文

posted @ 2021-04-17 16:35 {hunter}ZY 阅读(72) 评论(0) 推荐(0) 编辑

4.13关于爬虫

摘要：善意的爬⾍, 不破坏被爬取的⽹站的资源(正常访问, ⼀般频率不⾼, 不窃取⽤户隐私) 恶意的爬⾍, 影响⽹站的正常运营(抢票, 秒杀, 疯狂solo⽹站资源造成⽹站宕机) 反爬机制⻔户⽹站，可以通过制定相应的策略或者技术⼿段，防⽌爬⾍程序进⾏⽹站数据的爬取。反反爬策略爬⾍程序可以通过制定相阅读全文

posted @ 2021-04-13 12:24 {hunter}ZY 阅读(34) 评论(0) 推荐(0) 编辑

4.10

摘要：css分页 <!DOCTYPE html><html><head><style>.pagination { display: inline-block;}.pagination a { color: black; float: left; padding: 8px 16px; text-decora 阅读全文

posted @ 2021-04-10 10:15 {hunter}ZY 阅读(53) 评论(0) 推荐(0) 编辑

4.8

摘要：<time> 标签定义公历的时间（24 小时制）或日期，时间和时区偏移是可选的。该元素能够以机器可读的方式对日期和时间进行编码，这样，举例说，用户代理能够把生日提醒或排定的事件添加到用户日程表中，搜索引擎也能够生成更智能的搜索结果。阅读全文

posted @ 2021-04-08 08:38 {hunter}ZY 阅读(125) 评论(0) 推荐(0) 编辑

4.6

摘要：<canvas> 标签定义图形，比如图表和其他图像。例子：<canvas id="myCanvas"></canvas> <script type="text/javascript"> var canvas=document.getElementById('myCanvas'); var ctx= 阅读全文

posted @ 2021-04-06 12:36 {hunter}ZY 阅读(117) 评论(0) 推荐(0) 编辑

4.5

摘要：基本快捷键描述WindowsMac OS 编辑菜单 Alt + E Ctrl + F2 + F 文件菜单 Alt + F Ctrl + F2 + E 查看菜单 Alt + V Ctrl + F2 + V 选取所有文本 Ctrl + A Cmd + A 复制文本 Ctrl + C Cmd + C 查阅读全文

posted @ 2021-04-05 15:34 {hunter}ZY 阅读(425) 评论(0) 推荐(0) 编辑

{hunter}ZY

04 2021 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

推荐排行榜