摘要: 文档编号: 文档编号: 1 引言 1.1 编写目的 编写详细设计的目的是:在概要设计的基础上,完成系统划分模块及明确模块之间的关系,同时给出相应的用户界面设计。 1.2 适用对象及范围 本设计说明书适用于参加本项目的所有管理人员、开发人员和维护人员。包括:项目经理、系统分析员、高级程序员、代码程序员 阅读全文
posted @ 2019-01-20 12:29 我是一个粉刷匠^~^ 阅读(1144) 评论(0) 推荐(0) 编辑
摘要: 词云 搜索 typeIndex=null; ... 阅读全文
posted @ 2019-01-20 12:16 我是一个粉刷匠^~^ 阅读(693) 评论(0) 推荐(0) 编辑
摘要: 统计词语出现的频率,并且按从高到低的顺序报错在文件中 阅读全文
posted @ 2019-01-20 12:11 我是一个粉刷匠^~^ 阅读(432) 评论(0) 推荐(0) 编辑
摘要: 利用python过滤去没用的词语,过滤的词语存储在停用文件中。 阅读全文
posted @ 2019-01-20 12:08 我是一个粉刷匠^~^ 阅读(552) 评论(0) 推荐(0) 编辑
摘要: 利用python将标题切割成词语 阅读全文
posted @ 2019-01-20 12:06 我是一个粉刷匠^~^ 阅读(1018) 评论(0) 推荐(0) 编辑
摘要: package zuoye1; import java.sql.Connection;import java.sql.PreparedStatement;import java.sql.SQLException;import java.util.ArrayList;import java.util. 阅读全文
posted @ 2019-01-20 12:03 我是一个粉刷匠^~^ 阅读(576) 评论(0) 推荐(0) 编辑
摘要: 1.实验内容与完成情况:(实验具体步骤和实验截图说明) (一) MySQL 数据库操作 学生表 Student Name English Math Computer zhangsan 69 86 77 lisi 55 100 88 根据上面给出的 Student 表,在 MySQL 数据库中完成如下操作: (1)在 My... 阅读全文
posted @ 2019-01-20 11:59 我是一个粉刷匠^~^ 阅读(2846) 评论(0) 推荐(1) 编辑
摘要: .实验内容与完成情况:(实验具体步骤和实验截图说明) (一)编程实现以下指定功能,并用 Hadoop 提供的 HBase Shell 命令完成相同任务: (1) 列出 HBase 所有的表的相关信息,例如表名; 列出所有数据表: 列出表的结构 查询表是否存在 查询表是否可用 packagecn.wl.edu.hbase; import java.io.IOException; pub... 阅读全文
posted @ 2019-01-20 11:13 我是一个粉刷匠^~^ 阅读(4467) 评论(0) 推荐(0) 编辑
摘要: (一)编程实现以下功能,并利用 Hadoop 提供的 Shell 命令完成相同任务: (1) 向 HDFS 中上传任意文本文件,如果指定的文件在 HDFS 中已经存在,则由用户来指定是追加到原有文件末尾还是覆盖原有的文件; 上传文件 追加文件 覆盖文件 编程: package org.apache.hadoop.examples; import java.io.FileI... 阅读全文
posted @ 2019-01-20 10:54 我是一个粉刷匠^~^ 阅读(1788) 评论(0) 推荐(0) 编辑
摘要: tail 命令:取出后面几行 (20)查看当前用户主文件夹下.bashrc 文件内容,并且只列出 50 行以后的数据 chown 命令:修改文件所有者权限  tar 命令:压缩命令 grep 命令:查找字符串 (30)查看 JAVA_HOME 变量的值 熟悉常用的 Hadoop 操作 阅读全文
posted @ 2019-01-20 10:40 我是一个粉刷匠^~^ 阅读(4581) 评论(0) 推荐(0) 编辑
摘要: 1.在以前使用其他数据库时,经常会使用id自增来做主键,但是hbase数据库中不知道怎么来设置自增主键,所以我打算不要id自增主键。然后删除原来的表,重新创建表。 删除表语句: 阅读全文
posted @ 2019-01-20 10:20 我是一个粉刷匠^~^ 阅读(292) 评论(0) 推荐(0) 编辑
摘要: 1. 数据科学主要以统计学、机器学习、数据可视化以及(某一)领域知识为理论基础,其主要研究内容包括数据科学基础理论、数据预处理、数据计算和数据管理,数据科学的知识体系 数据预处理:为了提升数据质量、降低数据计算的复杂度、减少数据计算量以及提升数据处理的准确性,数据科学中需要对原始数据进行预处理——进 阅读全文
posted @ 2019-01-20 10:20 我是一个粉刷匠^~^ 阅读(391) 评论(0) 推荐(0) 编辑
摘要: 1.Impala hadoop的sql平台、支持hbase/hdfs、支持超大数据、支持多并发、sql支持好、对内存依赖比较严重。需要自己优化,并且有的语句超过内存会报错。 2.Spark 各种格式、各种计算(机器学习、图形计算)、可sql、可代码处理、支持scala/java/python语言开发 阅读全文
posted @ 2019-01-20 10:19 我是一个粉刷匠^~^ 阅读(178) 评论(0) 推荐(0) 编辑