上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 38 下一页
摘要: linux学习 因为要学习Hadoop大数据,会用到Linux服务器集群来做,因此有必要回顾一下当年大一所学习的Linux知识 1|1①Linux系统有7个运行级别(runlevel): 运行级别0:系统停机状态,系统默认运行级别不能设为0,否则不能正常启动 运行级别1:单用户工作状态,root权限 阅读全文
posted @ 2020-08-10 21:24 喜欢爬的孩子 阅读(280) 评论(2) 推荐(0) 编辑
摘要: hadoop是分布式系统基础架构: 1)主要解决的是海量数据的存储和海量数据的分析计算 2)haddop的三大发行版本,一下这个是免费的版本 3)hadoop的优势 高可靠性、高扩展性、高效性(并行工作)、高容错性 4)hadoop1.x组成:common辅助工具、hdfs数据存储、MapReduc 阅读全文
posted @ 2020-08-10 21:15 喜欢爬的孩子 阅读(132) 评论(0) 推荐(0) 编辑
摘要: 这次是爬取音乐的相关内容之后写进数据库: 具体的实验代码如下: import requests import pymysql #用此函数爬取网页数据 def get_html(): url='https://u.y.qq.com/cgi-bin/musics.fcg?-=getUCGI6632950 阅读全文
posted @ 2020-08-09 21:16 喜欢爬的孩子 阅读(377) 评论(0) 推荐(0) 编辑
摘要: 在虚拟机上进行用户的增加: 以及相应的其他命令的设置: 阅读全文
posted @ 2020-08-09 20:12 喜欢爬的孩子 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 可以右键选快照拍摄快照。相当于数据库的备份操作,方便之后出错后修复; 快照的删除和恢复: 1)linux进行文件的解压: 在上边输入rz进行目录选择自己想要上传的压缩包 2) 4) 阅读全文
posted @ 2020-08-09 20:06 喜欢爬的孩子 阅读(106) 评论(0) 推荐(0) 编辑
摘要: linux的操作命令(首先是对其目录的结构进行了解) ctrl+l进行清屏操作 1)ls命令: 名字为:显示文件列表命令 h相比较更加人性。 ls -l和ll是等价的 最常用的是ls和ll 2)pwd、mkdir、rm命令 pwd查看当前所在的路径。mkdir是创建文件夹或者是创建目录。 在当前的目 阅读全文
posted @ 2020-08-08 20:56 喜欢爬的孩子 阅读(107) 评论(0) 推荐(0) 编辑
摘要: 今天主要是进行了centos的相关配置以及安装。对于操作的流程如下: 阅读全文
posted @ 2020-08-08 16:09 喜欢爬的孩子 阅读(116) 评论(0) 推荐(0) 编辑
摘要: 这一周自己大约一共发了10篇博客: 所涉及到的内容是爬虫、算法、python基础学习。 其中对于Python的爬虫学习比较深入,实战了4、5个项目,涉及到了网页爬取的时候关于静态动态的处理,然后就是筛选数据、将数据存放到excel中并生成各种图标(柱形图、圆饼图等等) 然后在算法方面,自己学习的主要 阅读全文
posted @ 2020-08-06 20:32 喜欢爬的孩子 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 代码的验颜值真的很重要 1)对于if语句另外一个使用的方法: m=a if a<b else b;通c++中的语句类似但是不一样 2)while和else语句连用。 可以用来比较准确的来判断while循环的次数,以及他的执行情况 3)对于for循环的迭代过程: for i in 'wen': 之后可 阅读全文
posted @ 2020-08-06 18:24 喜欢爬的孩子 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 程序的代码如下: 完成的操作:爬取相关的信息之后保存到数据库之中 '''使用面向对象的方式,搭建项目框架''' import requests import openpyxl from bs4 import BeautifulSoup import pymysql class LianJiaSpid 阅读全文
posted @ 2020-08-05 18:34 喜欢爬的孩子 阅读(311) 评论(0) 推荐(0) 编辑
上一页 1 ··· 16 17 18 19 20 21 22 23 24 ··· 38 下一页