04 2018 档案

摘要:一、Hadoop提供的Shell命令完成相同任务: 4.使用命令把本地文件系统中的“txt”上传到HDFS中的当前用户目录的input目录下。 5.查看hdfs中的文件(-ls) 6.显示hdfs中该的文件内容 7.删除本地的txt文件并查看目录 8.从hdfs中将txt下载地本地原来的位置。 9. 阅读全文
posted @ 2018-04-27 10:44 QH.Thomas 阅读(299) 评论(0) 推荐(0) 编辑
摘要:现在有四张表:student(学生表)、blogs(博客表)、comment(评论表)、reply(回复表) 现在说一下这四张表: student(学生表):学生的信息记录表 blogs(博客表):学生发表的博客表 comment(评论表):学生评论博客文章的表 reply(回复表):学生回复评论的 阅读全文
posted @ 2018-04-22 21:43 QH.Thomas 阅读(315) 评论(0) 推荐(0) 编辑
摘要:词云 利用python对电影评价的爬取 一、抓取网页数据 1:网页爬取一些数据的前期工作 :2:爬取得到的html解析 from bs4 import BeautifulSoup as bs soup = bs(html_data, 'html.parser') nowplaying_movie = 阅读全文
posted @ 2018-04-22 10:59 QH.Thomas 阅读(6733) 评论(0) 推荐(0) 编辑
摘要:3、截图 4、print(df1['2018-04-11']) 阅读全文
posted @ 2018-04-17 20:41 QH.Thomas 阅读(180) 评论(0) 推荐(0) 编辑
摘要:def getNewDetail(newsUrl): # 标题 newTitle = new.select('.news-list-title')[0].text # 时间 time = new.select('span')[0].text # 来源 resource = new.select('s 阅读全文
posted @ 2018-04-10 17:43 QH.Thomas 阅读(215) 评论(0) 推荐(0) 编辑
摘要:import reimport requestsnewsurl = 'http://news.gzcc.cn/html/2018/xiaoyuanxinwen_0925/8249.html'def getClickCount(newsurl): mymach = re.match('http://n 阅读全文
posted @ 2018-04-10 16:20 QH.Thomas 阅读(263) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示