摘要: 今日收获 学习了有关python的知识,已经有关大数据的知识; 背了单词; 明天预计 明天只有一节课,然后就要好好准备准备学习自己的代码技术啦! 阅读全文
posted @ 2023-09-19 23:25 yesyes1 阅读(2) 评论(0) 推荐(0) 编辑
摘要: 打开pycharm里面的json文件之后, 想要将其标准化,就直接使用快捷键: Ctrl+Alt+L即可; 效果如图所示: 意满离~~ 阅读全文
posted @ 2023-09-19 22:14 yesyes1 阅读(428) 评论(0) 推荐(0) 编辑
摘要: dump dump是将json数据写进文件 dumps dumps是将字典类型的数据转换为字符串 如果不能区分好这两个函数,就很容易犯这个错误: TypeError: init() got an unexpected keyword argument 'fp' (别问我为啥知道奥~) 阅读全文
posted @ 2023-09-19 20:48 yesyes1 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 1、分析题目--同样是对页面的部分数据进行分析 2、编写url、user-agent等必要条件 参数params内容在负载里面就能看到啦! 3、将得到的list_data写成json数据 4、查看执行结果 成功! 阅读全文
posted @ 2023-09-19 20:46 yesyes1 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 1、分析题目 我们想要分析的是,在我们输入文本框数据之后,刷新显现出来的数据文本,而不是上一篇的整个页面的数据,所以,我们在查看后台运行情况时,不必查看全部: 只需要查看其中的XHR部分即可: 2、找到部分页面数据对应的包 找了半天,可算是找到对应的上的了: (标头、负载、响应是否对应); 3、然后 阅读全文
posted @ 2023-09-19 20:23 yesyes1 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 打开Pycharm 1、获取到网页的url 想要的是信息采集,query后面的参数留下,其余参数舍去: 也可以写为: 2、将url携带的参数封装到字典中(也就是对url携带参数的处理) 并将参数获取实现动态化: 3、发起请求--get 4、保存request.get内容 5、设置请求载体的身份标识- 阅读全文
posted @ 2023-09-19 18:22 yesyes1 阅读(26) 评论(0) 推荐(0) 编辑
摘要: 1、新建一个名为file1.txt的txt文件存储数据 2、在sss数据库中新创建一个名为docs的表 create table if not exists docs(line string); 3、将file1.txt的数据导入到新创建的docs表中 load data local inpath 阅读全文
posted @ 2023-09-19 15:17 yesyes1 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 问题描述 今天再次打开虚拟机(之前交完作业之后,就不敢再打开了,害怕看到报错信息),打开hive之后,启用hive命令时,发现了这个问题; 问题解决 经查阅资料发现,原来是因为我再使用hive命令之前,没有开启metastore服务和hiveserver2服务,先开启了这两个服务,再进入hive里面 阅读全文
posted @ 2023-09-19 14:54 yesyes1 阅读(391) 评论(0) 推荐(0) 编辑