04 2018 档案
摘要:一、Hadoop提供的Shell命令完成相同任务: 4.使用命令把本地文件系统中的“txt”上传到HDFS中的当前用户目录的input目录下。 5.查看hdfs中的文件(-ls) 6.显示hdfs中该的文件内容 7.删除本地的txt文件并查看目录 8.从hdfs中将txt下载地本地原来的位置。 9.
阅读全文
摘要:现在有四张表:student(学生表)、blogs(博客表)、comment(评论表)、reply(回复表) 现在说一下这四张表: student(学生表):学生的信息记录表 blogs(博客表):学生发表的博客表 comment(评论表):学生评论博客文章的表 reply(回复表):学生回复评论的
阅读全文
摘要:词云 利用python对电影评价的爬取 一、抓取网页数据 1:网页爬取一些数据的前期工作 :2:爬取得到的html解析 from bs4 import BeautifulSoup as bs soup = bs(html_data, 'html.parser') nowplaying_movie =
阅读全文
摘要:3、截图 4、print(df1['2018-04-11'])
阅读全文
摘要:def getNewDetail(newsUrl): # 标题 newTitle = new.select('.news-list-title')[0].text # 时间 time = new.select('span')[0].text # 来源 resource = new.select('s
阅读全文
摘要:import reimport requestsnewsurl = 'http://news.gzcc.cn/html/2018/xiaoyuanxinwen_0925/8249.html'def getClickCount(newsurl): mymach = re.match('http://n
阅读全文