08 2022 档案
摘要:这一周主要是进行了python的爬虫的练习 首先我爬取热词的地址是博客园:https://news.cnblogs.com/n/recommend 然后在里面筛选出100个出现频率最高的信息热词。 import jieba import pandas as pd import re from col
阅读全文
摘要:前两周由于安装配置hadoop的时候出现了一点的问题所以花费的时间长了一点,同时在上个星期觉得用了许多的linux的命令所以也去学了一部分的linux的命令。 所以这一周主要是学习了一部分的hadoop的知识,首先是了解了hadoop中的各个组件是干什么用的 hadoop核心组件有HDFS、MapR
阅读全文
摘要:上周的虚拟机配置到最后发现了出现了一点问题一直配置不好一开始也没有发现到了最后才发现我的xshell只能连接一台克隆机,不能同时连接三台虚拟机,这也就代表着接下来的步骤没有办法继续进行了,所以接下来我就检查了我之前的配置发现都没有啥毛病,最后没有办法只能是把克隆机都删除了,然后重新尽心配置。。。。。
阅读全文