摘要:
有时候需要从一个excel或者多个excel读取多列数据,然后传到后面的步骤内去执行操作 这里就涉及到把数据合并再分割的问题,比如下图excel数据,取出两列手机号和余额 思路,先从目标excel内逐列读出数据,创建数列 wb = xlrd.open_workbook(path+'\\2021.xl 阅读全文
摘要:
暂时没想到这个能用来干什么,只是刚好看到相关文章,学习一下,就拿获取基金信息来做试验把 爬取基金的信息就不介绍了,请参考https://www.cnblogs.com/becks/p/14500495.html 这里主要是对输出内容修改了,改成不写入表格,实时打印出来 正文,通过调用别人已经架设好的 阅读全文
摘要:
前面分析统计了金庸名著《倚天屠龙记》中人物按照出现次数并排序 https://www.cnblogs.com/becks/p/11421214.html 然后使用pyecharts,统计B站某视频弹幕内容,并绘制成词云显示 https://www.cnblogs.com/becks/p/147430 阅读全文
摘要:
我们使用beatifulsop爬取到B站视频的字幕:https://www.cnblogs.com/becks/p/14540355.html 然后将爬取的字幕,使用pandas处理后写到CSV文件中:https://www.cnblogs.com/becks/p/14738496.html 本篇, 阅读全文
摘要:
上文,我们爬取到B站视频的字幕:https://www.cnblogs.com/becks/p/14540355.html 这篇,讲讲怎么把爬到的字幕写到CSV文件中,以便用于后面的分析 本文主要用到“pandas”这个库对数据进行处理 import pandas as pd 首先需要对爬取到的内容 阅读全文
摘要:
前面的案例里,均采用正则匹配的方式取值 title = re.findall('">(.*?)</a>', i, re.S)[0]#标题 url = re.findall('="(.*?)" target', i, re.S)[0]#地址 这么写的容错能力有限,爬取的数据越多,越容易出现匹配不到内容 阅读全文
摘要:
这个帖子内讲了怎么发邮件:https://www.cnblogs.com/becks/p/14589314.html 下图红框内于发送目标邮件地址有关 讲红框内信息修改为下方代码,即可实现向多人发送邮件 msg_to=['xxx@qq.com','xxxxx@qq.com'] msg['To'] = 阅读全文
摘要:
在写爬虫的过程中发现,很多网站的信息均以当天日期为链接组成部分,但是格式又不相同 有些是20210328,有些是2021-03-28,还有些2021/03/28 如果一次爬取来源不同网站的信息,需要对日期格式进行处理 先上代码 import datetime def getYesterday(): 阅读全文
摘要:
下方代码,判断sta内是否包含s数组内的数字,只要包含任意一个输入ok,否则输出no s=['3','8','9'] sta='59' if s[0] in sta or s[1] in sta or s[2] in sta: print("ok") else: print("no") if后面的内 阅读全文
摘要:
怎么发QQ邮件,网上的例子很多,就不介绍了,具体可参考:https://www.jianshu.com/p/0f8c5e4e7054 这里主要把自定义邮件内容写一下 # -*- coding: utf-8 -*- import smtplib from email.mime.text import 阅读全文