摘要: pandas数据查找替换,提供以下三种方法:手工一个个替换、replace替换、map映射替换 除此之外,还可创建一个dataframe进行merge或join匹配(同vlookup) 首先创建数据: import pandas as pd df = pd.DataFrame([["a", 'wai 阅读全文
posted @ 2022-03-30 20:42 啊呀啊呀静 阅读(1514) 评论(0) 推荐(0)
摘要: 1、python连接sqlite3,anaconda默认已经安装了sqlite3 # 拓展:链接sql数据库 import sqlite3 import pandas as pd # import pymysql 默认已经安装了sqlite3 con = sqlite3.connect("test. 阅读全文
posted @ 2022-03-30 20:27 啊呀啊呀静 阅读(111) 评论(0) 推荐(0)
摘要: pandas分组计数:查看每个元素出现的次数 相当于SQL语句中distinct,以及EXCEL中删除重复项,查看每个选项有多少个元素 提供以下四种办法:value_counts、size、groupby、groupby...agg 新建dataframe样例: import pandas as p 阅读全文
posted @ 2022-03-30 20:06 啊呀啊呀静 阅读(5754) 评论(0) 推荐(0)
摘要: python安装注意事项: 1、 在清华镜像源的网址里面选择自己电脑相应的版本,下载anaconca,原则上3以上的都可以,我分享演示的版本是Anaconda3-5.3.1(苹果电脑安装mac版本) https://mirrors.tuna.tsinghua.edu.cn/anaconda/arch 阅读全文
posted @ 2022-01-19 10:04 啊呀啊呀静 阅读(124) 评论(0) 推荐(0)
摘要: from urllib.request import urlopen from bs4 import BeautifulSoup as BS url = "http://www.lagou.com" # (1)获取response对象 response = urlopen(url) # (2)获得r 阅读全文
posted @ 2021-06-24 19:32 啊呀啊呀静 阅读(72) 评论(0) 推荐(0)
摘要: 解析源码:不仅可以使用正则表达式,还可以用beautifulsoup 1) select(标签名)数据标签进行查找 2)通过类名# class属性 对应的值进行查找:.class的属性值 3)通过id的值、id属性对应的值进行查找:#id属性的值 4)组合查找# 不同的查找之间通过空格隔开就可以了 阅读全文
posted @ 2021-06-24 19:31 啊呀啊呀静 阅读(187) 评论(0) 推荐(0)
摘要: 举例:下载某网页的图片保存到本地 1、urlopen打开链接2、respon.read()获得字节3、对爬取结果的存储 1 from urllib.request import urlopen 2 url_img = 'https://www.lgstatic.com/i/image2/M01/09 阅读全文
posted @ 2021-06-24 19:27 啊呀啊呀静 阅读(198) 评论(0) 推荐(0)
摘要: 爬虫的步骤: 1)使用python获得url的源码(向服务器发送请求) 2)获得response的响应对象,获得响应的源码 3)解析源码(正则表达式),获得需要抓取的数据 4)存储爬取的资源(可写入到文件中,也可以写入到数据库中) 1 from urllib.request import urlop 阅读全文
posted @ 2021-06-24 19:23 啊呀啊呀静 阅读(118) 评论(0) 推荐(0)
摘要: 需要安装的依赖包:PIL Pytesseract 1、安装包 PIL 就是pillow包,直接找到对应的whl包安装(https://www.lfd.uci.edu/~gohlke/pythonlibs/) 注意:pillow是用于替代PIL的,所以在实际使用中需要import PIL而不是pill 阅读全文
posted @ 2021-01-08 16:05 啊呀啊呀静 阅读(2962) 评论(0) 推荐(0)
摘要: 1、list\ndarray\dataframe的相互转换 list转ndarray: import numpy as np li = [1, 3, 5, 6] linp = np.array(li) print(li, linp) ndarray转dataframe: import numpy a 阅读全文
posted @ 2021-01-08 10:34 啊呀啊呀静 阅读(127) 评论(0) 推荐(0)