摘要:
本周做了软件设计的作业,同时学习了HBASE数据库的连接的相关知识点。 Connection是什么?常见的使用Connection的错误方法有: 自己实现一个Connection对象的资源池,每次使用都从资源池中取出一个Connection对象;每个线程一个Connection对象。每次访问HBas 阅读全文
摘要:
本周写了石家庄明石印染厂生产销售管理系统的代码,3个小时的时间弄这个管理系统时间不太够,由于我写的页面模板不多,页面代码和Dao层的代码占用的时间太多了,并且刚开始读题目的时候没有总结,后面写的越来越乱,后面还需要整理一下,以至于这个系统没有写完。 阅读全文
摘要:
大三开学的第一周,我们开始上课了,每天开始了上课,在闲暇之余也去练了Hadoop连接数据库的练习。 1 mysql数据导入到hdfs数据 hadoop提供了org.apache.hadoop.io.Writable接口来实现简单的高效的可序列化的协议,该类基于DataInput和DataOutput 阅读全文
摘要:
一、 (1) 项目名称:信息化领域热词分类分析及解释 (2) 功能设计: 数据采集:要求从定期自动从网络中爬取信息领域的相关热 词; 数据清洗:对热词信息进行数据清洗,并采用自动分类技术 生成信息领域热词目录,; 热词解释:针对每个热词名词自动添加中文解释(参照百度 百科或维基百科) 热词引用:并对 阅读全文
摘要:
本周自学了大数据技术 linux shell脚本: shell脚本的运行主要分为新建、编辑和执行三个步骤。 1、新建脚本文件 脚本文件新建可以用touch命令,也可以直接用文本编辑器如vi、vim、gedit等新建并编辑,文件名为*.sh shell脚本文件的名称可以任意,但为了避免被误认为是普通文 阅读全文
摘要:
本周继续学习了Hadoop的知识点。 HDFS 使用 HDFS Shell 回到 hdfs_single 容器,以下命令将用于操作 HDFS: # 显示根目录 / 下的文件和子目录,绝对路径 hadoop fs -ls / # 新建文件夹,绝对路径 hadoop fs -mkdir /hello # 阅读全文
摘要:
本周学习了Hadoop的一些知识点并进行了尝试。 Hadoop 三种模式:单机模式、伪集群模式和集群模式。 单机模式:Hadoop 仅作为库存在,可以在单计算机上执行 MapReduce 任务,仅用于开发者搭建学习和试验环境。 伪集群模式:此模式 Hadoop 将以守护进程的形式在单机运行,一般用于 阅读全文
摘要:
本周学习了Python的一些基础知识点。并且学习了一些代码。 变量名命名规范 变量名也可称之为标识符(变量名、函数名、类名、包名等统称为标识符) 其命名要符合python的语法要求: 由数字、字母、下划线组成,不能以数字开头 严格区分大小写 不能是python的关键字(保留字) 变量命名风格见名知意 阅读全文
摘要:
这周学了python爬虫的知识点。 关于爬虫的合法性几乎每一个网站都有一个名为 robots.txt 的文档,当然也有部分网站没有设定 robots.txt。对于没有设定 robots.txt 的网站可以通过网络爬虫获取没有口令加密的数据,也就是该网站所有页面数据都可以爬取。如果网站有 robots 阅读全文
摘要:
本周写了长整数的四则运算系统,还练习了图书管理系统连接Hadoop的数据库,代码时间:每天两小时左右,同时学习了python爬虫连接数据库的实例。 下周开始学习python爬虫网络热词的主要知识点。 遇到的问题: (1)python在连接数据库时出现了报错: 原因因为数据库参数中的数据库名称出现了错 阅读全文