摘要:
选择博客园的原因、本博客样式的配置、后期规划 阅读全文
摘要:
MySQL基础,包含学习目标、MySQL的安装、SQL编程基础、DQL、DML、DDL、DCL等内容,内含MySQL代码模板 阅读全文
摘要:
本文包括的知识有:对象序列化、 数据库与数据文件管理、网络爬虫与信息提取,其中爬虫基础中介绍了多种方法(数据挖掘的urllib、requests,数据清洗的XPath、RE正则、jsonpath、 BeautifulSoup等和爬虫Scrapy框架),另外还解释了 Selenium工具 阅读全文
摘要:
kettle的简介和安装 阅读全文
摘要:
使用Windows环境下编写HDFS的JavaAPI,其中基本操作有对文件的读、写、追加、删除等。新建文件夹、删除文件夹等。还可显示文件及文件夹的属性,并附带maven项目的基本配置等操作。 阅读全文
摘要:
本文主要记述了VI/VIM编辑器的使用,系统管理、文件目录管理、用户管理、用户组管理、文件权限、压缩解压、磁盘分区、线程进程管理、系统定时任务设置等操作的命令,并简单总结了Shell编程一些基础知识,以供大家学习和参考。 阅读全文
摘要:
使用VMware虚拟机安装CentOS7.x配置模板虚拟机Hadoop100后,对其进行克隆出Hadoop102、Hadoop103和Hadoop104,从而形成Hadoop集群,并对Hadoop集群进行“查看历史版本”“查看日志”等配置,形成一个完整的Hadoop集群,为后续Hadoop集群进行数据分析打下基础 阅读全文