ふじわらたくみ

2021年10月12日

摘要：数据分析的概念什么是数据分析就是从现有的数据中挖掘出价值数据分析应用领域商品推荐 eg：在淘宝上搜索了一款商品之后接下来会疯狂给推荐相关的产品相关产品量化交易股票期货等数据分析短视频推送抖音今日头条等短视频推荐数据分析是未来所有公司不可或缺的岗位，目前社会上获取数据的方式阅读全文

posted @ 2021-10-12 15:29 ふじわらたくみ阅读(286) 评论(0) 推荐(0)

2021年10月10日

MongoDB补充知识

摘要：文档操作的补充涉及到数据的嵌套查找支持直接点键或者索引 db.t1.deleteOne({'addr.counytry':'Japan'}) db.t1.deleteOne({'hobby.1':'tea'}) .键.索引.索引.键可以无限制往下点点点用户权限管理涉及到用户权限相关引号推阅读全文

posted @ 2021-10-10 19:46 ふじわらたくみ阅读(57) 评论(0) 推荐(0)

2021年10月8日

爬虫框架scrapy和MongoDB的基础知识

摘要：爬虫框架scrapy 框架：别人提前给我们搭建好了基本的架构具备了一定的功能 Scrapy是网络爬虫中使用频率最高功能最为完善的框架下载scrapy框架 pip3 install scrapy 苹果笔记本直接下载就可以但是Windows电脑可能会出现错误 windows电脑如果下载报错并且没阅读全文

posted @ 2021-10-08 16:19 ふじわらたくみ阅读(152) 评论(0) 推荐(0)

2021年10月7日

爬虫案例xpath和防爬措施

摘要：百度自动登录 from selenium import webdriver import time # 1.使用谷歌浏览器访问百度首页 bro = webdriver.Chrome() bro.get('https://www.baidu.com/') # 2.查找页面上的登录按钮 login_ta 阅读全文

posted @ 2021-10-07 19:02 ふじわらたくみ阅读(138) 评论(0) 推荐(0)

2021年9月29日

selenuim模块的其他使用方法验证码的破解思路和大型复杂的爬虫案例

摘要： selenuim模块的其他使用方法获取属性 tag.get_attribute('src') 获取文本内容 tag.text 获取标签ID，位置，名称，大小 print(tag.id) print(tag.location) print(tag.tag_name) print(tag.size) 阅读全文

posted @ 2021-09-29 19:14 ふじわらたくみ阅读(46) 评论(0) 推荐(0)

2021年9月28日

xpath模块的练习题

摘要：爬取城市名称 import requests from lxml import etree # 1.发送请求获取页面数据 res = requests.get("https://www.aqistudy.cn/historydata/", headers={ 'User-Agent': "Mozil 阅读全文

posted @ 2021-09-28 19:15 ふじわらたくみ阅读(342) 评论(0) 推荐(0)

xpath解析库以及练习题

摘要：爬取豆瓣top250 import requests # 请求库 from bs4 import BeautifulSoup # 解析库 from openpyxl import Workbook import time wb = Workbook() wb1 = wb.create_sheet(' 阅读全文

posted @ 2021-09-28 09:02 ふじわらたくみ阅读(638) 评论(0) 推荐(0)

2021年9月26日

openpyxl练习题

摘要：爬取豆瓣top250 在爬取的时候发生了一点小插曲我们的IP被锁了 import requests proxies = { 'http': '114.99.223.131:8888', 'http': '119.7.145.201:8080', 'http': '175.155.142.28:80 阅读全文

posted @ 2021-09-26 13:43 ふじわらたくみ阅读(99) 评论(0) 推荐(0)

爬取梨视频教程

摘要：梨视频爬取教程 1.我们首先先要查看这个地址是否能直接连接到我们所需要的视频 2.通过点击这个视频地址我们发现是直接加载在网页上面的，这个时候事情就容易多了 3.然后我们需要分析这个地址所在的a标签的规律并且使用方法找到所需要的标签数据 4.进一步检查他的转跳窗口地址并没有给全那就手动加上前面部分阅读全文

posted @ 2021-09-26 10:08 ふじわらたくみ阅读(119) 评论(0) 推荐(0)

2021年9月23日

openpyxl模块以及练习题的讲解

摘要：在查找标签的时候有两种策略 1.指名道姓的查找待查找的标签本身就具备很强的辨识度 2.先整体再局部待查找的标签本身没有很强的辨识度并且很多地方都有相似的标签此时可以先查找该标签的祖先标签再一步一步查找其后代标签拿到需要的数据梨视频多页数据的爬取 import requests from b 阅读全文

posted @ 2021-09-23 19:15 ふじわらたくみ阅读(161) 评论(0) 推荐(0)

ふじわらたくみ

公告