今天123

2020年2月7日

摘要： python采集某市政百姓信件内容 #coding:utf-8 import requests from lxml import etree import time import pymysql import datetime import urllib import json from IPyth 阅读全文

posted @ 2020-02-07 21:52 今天123 阅读(243) 评论(0) 推荐(0) 编辑

2020年2月6日

寒假自学进度7

摘要：相比较spark来说我感觉python还是更容易上手，今天在家开始了一些简单的爬虫，明天将要继续。阅读全文

posted @ 2020-02-06 21:31 今天123 阅读(60) 评论(0) 推荐(0) 编辑

2020年2月5日

寒假自学进度6

摘要：今天在B站上面看了python学习视频学习地址：https://www.bilibili.com/video/av14184325 菜鸟教程上面有详细的资料目录，在上面进行了一些简单的练习早上起来的时候看了一部分考研单词，感觉明天还是会忘记。明天还要继续阅读全文

posted @ 2020-02-05 22:51 今天123 阅读(66) 评论(0) 推荐(0) 编辑

2020年2月4日

寒假自学5

摘要：今天看了实验的第二题感觉好难啊 2. 模拟图形绘制对于一个图形绘制程序，用下面的层次对各种实体进行抽象。定义一个 Drawable 的特质，其包括一个 draw 方法，默认实现为输出对象的字符串表示。定义一个 Point 类表示点，其混入了 Drawable 特质，并包含一个 shift 方法阅读全文

posted @ 2020-02-04 22:02 今天123 阅读(122) 评论(0) 推荐(0) 编辑

2020年2月3日

寒假自学学习4

摘要：今天观看桂尚谷大数据学习视频跟着学习Scala基础： https://www.bilibili.com/video/av39126512?from=search&seid=3479125343083328567 阅读全文

posted @ 2020-02-03 22:03 今天123 阅读(96) 评论(0) 推荐(0) 编辑

2020年2月2日

寒假自学进度3

摘要：今天根据老师发的资料完成了一道例题：计算级数请用脚本的方式编程计算并输出下列级数的前 n 项之和 Sn，直到 Sn 刚好大于或等于 q 为止，其中 q 为大于 0 的整数，其值通过键盘输入。     例如，若 q 的值为 50.0，则输出应为：Sn=50.416695。请将源文件保存为阅读全文

posted @ 2020-02-02 21:11 今天123 阅读(73) 评论(0) 推荐(0) 编辑

2020年2月1日

寒假自学进度2

摘要：我今天参考网上的教程对spark进行了安装：在spark官网上下载spark 地址： http://mirrors.hust.edu.cn/apache/spark/spark-2.4.0/spark-2.4.0-bin-hadoop2.7.tgz 安装spark 命令如下： sudo tar - 阅读全文

posted @ 2020-02-01 21:15 今天123 阅读(105) 评论(0) 推荐(0) 编辑

2020年1月31日

寒假自学进度报告1

摘要：今天我主要了解了spark的一些专业名词以及相关特点： spark简介：最初由美国加州伯克利大学的AMP实验室于2009年开发，是基于内存计算的大数据计算框架，可用于构建大型，低延迟的数据分析应用程序 2014年打破了hadoop保持的基准排序记录 Spark具有以下特点：运行速度快：使用DAG 阅读全文

posted @ 2020-01-31 20:09 今天123 阅读(190) 评论(0) 推荐(0) 编辑

2019年11月15日

MapReduce之简单的数据清洗----课堂测试进度三

摘要：今天完成的是将mapreduce清洗后的数据导入hive数据库：第一步：需要熟练的知道如何操作hive数据库，一些简单的命令必须掌握。进入hive数据库然后创建hive数据库：使用创建的hive数据库并创建表将数据导入test表中：查询hive数据库中test表格中的数据：数据过多所以阅读全文

posted @ 2019-11-15 22:35 今天123 阅读(163) 评论(0) 推荐(0) 编辑

2019年11月14日

MapReduce之简单的数据清洗----课堂测试进度2

摘要：进行数据清洗首先开启Hadoop 然后在eclipse里面创建MapReduce项目之后写代码： package 数据清洗hive; import java.io.IOException; import java.text.SimpleDateFormat; import java.util.Da 阅读全文

posted @ 2019-11-14 19:40 今天123 阅读(226) 评论(0) 推荐(0) 编辑

公告