上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 22 下一页
摘要: 出现问题:拉不动,扩展不了分区大小: 解决:首先在设置了里面扩大硬盘大小: 之后下载Gparted工具:gparted-live-0.8.0-5.iso(下载地址:https://pan.baidu.com/s/1dEkynuT?fid=849334167383758) (1)加载ISO映像: (2 阅读全文
posted @ 2019-03-04 00:11 小程大序的猿 阅读(698) 评论(0) 推荐(0) 编辑
摘要: 参考:https://www.cnblogs.com/soyo/p/7686702.html 阅读全文
posted @ 2019-02-15 21:20 小程大序的猿 阅读(325) 评论(0) 推荐(0) 编辑
摘要: 报错情况: 解决方法: SQLContext可能需要自己创建。 所以,先运行var sqlContext=new org.apache.spark.sql SQLContext(sc)。即可。 之后再倒入: 阅读全文
posted @ 2019-02-15 20:13 小程大序的猿 阅读(376) 评论(0) 推荐(0) 编辑
摘要: 启动hadoop报错: 解决方法: 我发现没有9000端口被占用,也不知道9000到哪去了,但是也没有NameNode,于是,直接把NameNode格式化了,再重启HDFS即可。 格式化命令: 阅读全文
posted @ 2019-02-14 17:14 小程大序的猿 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 今天第一次接触hive这个东东,跟着教程走,当把本地文件的数据装载到新建的hive的表中时,得到的结果是NULL,如图: 也不知道为什么,初次接触,对它的这个构造还不是很熟悉,看一下建表语句: 解决:问题就出在分隔符上,我的建表语句分隔符是'\t','\t’代表的是tab符号,你键盘上的tab键,所 阅读全文
posted @ 2019-02-14 15:02 小程大序的猿 阅读(1654) 评论(1) 推荐(0) 编辑
摘要: 这是网页上的script 我要获取的是00914这个数字 直接使用正则表达式即可 运行结果: 源码: 阅读全文
posted @ 2019-02-11 19:35 小程大序的猿 阅读(26980) 评论(0) 推荐(0) 编辑
摘要: 不需要像eclipse那样添加驱动包,在pycharm里面下载一个pymysql包即可。 然后链接自己电脑的mysql并进行访问即可。 源码如下(参考博客:https://blog.csdn.net/just_so_so_fnc/article/details/72995731) 阅读全文
posted @ 2019-02-09 21:03 小程大序的猿 阅读(2586) 评论(0) 推荐(0) 编辑
摘要: 利用了beautifulsoup进行爬虫,解析网址分页面爬虫并存入文本文档: 结果: 源码: 阅读全文
posted @ 2019-02-09 17:40 小程大序的猿 阅读(932) 评论(0) 推荐(0) 编辑
摘要: 使用requests , lxml ,xpath进行爬取并写入了TXT(也可以存入数据库)。参考博客:https://blog.csdn.net/yexing_cts/article/details/80855059 话不多说,直接上源码: 运行结果: 阅读全文
posted @ 2019-02-09 15:48 小程大序的猿 阅读(889) 评论(0) 推荐(0) 编辑
摘要: 今天尝试使用pycharm+beautifulsoup进行爬虫测试。我理解的主要分成了自己写的HTML和百度上的网页两种吧。第一种,读自己写的网页(直接上代码): (主要参考博客:https://blog.csdn.net/Ka_Ka314/article/details/80999803) HTM 阅读全文
posted @ 2019-02-08 16:38 小程大序的猿 阅读(4288) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 22 下一页