上一页 1 ··· 38 39 40 41 42 43 44 45 46 ··· 50 下一页

2019年7月19日

Numpy

摘要: 0. NumPy介绍 NumPy是Python的一个高性能科学计算和数据分析基础库,提供了功能强大的多维数组对象ndarray。 引入numpy,并重命名为np,方便使用 import numpy as np 1. 创建数组 1.1使用numpy内置的array函数创建数组 创建一维数组 arr1 阅读全文

posted @ 2019-07-19 17:24 农夫三拳有點疼 阅读(294) 评论(0) 推荐(0) 编辑

pandas

摘要: 0 pandas介绍 Pandas是一款开放源码的BSD许可的Python库,为Python编程语言提供了高性能,易于使用的数据结构和数据分析工具。使用import pandas as pd导入pandas包并且起个响亮的名字pd 1 读取数据的方式 1.1准备数据表csv文件 it01.csv 1 阅读全文

posted @ 2019-07-19 17:10 农夫三拳有點疼 阅读(153) 评论(0) 推荐(0) 编辑

6 MapReduce的理解

摘要: 0 MapReduce的定义 源自于Google的MapReduce论文 发表于2004年12月 Hadoop MapReduce是Google MapReduce克隆版 MapReduce特点 易于编程 良好的扩展性 高容错性 适合PB级以上海量数据的离线处理 MapReduce不擅长的方面 实时 阅读全文

posted @ 2019-07-19 16:09 农夫三拳有點疼 阅读(172) 评论(0) 推荐(0) 编辑

7 MapReduce案例

摘要: 1 java编程步骤 导入需要jar包 找到一个模板例子复制为我们的word count类 import java.io.IOException; import java.util.Iterator; import java.util.StringTokenizer; import org.apac 阅读全文

posted @ 2019-07-19 16:08 农夫三拳有點疼 阅读(23) 评论(0) 推荐(0) 编辑

1 虚拟机及CentOs7配置

摘要: Begin 准备工作a)下载VMware workstation14 b)下载CentOS7CentOS7c)下载xshell、xftp安装参考最好改成单文件储存,不容易出问题 分区设置 补充1 nat网络设置 (注意如果不在意网络IP冲突问题可以使用桥接模式,方便使用,就不用配置下面的东西了)下面 阅读全文

posted @ 2019-07-19 16:01 农夫三拳有點疼 阅读(32) 评论(0) 推荐(0) 编辑

上一页 1 ··· 38 39 40 41 42 43 44 45 46 ··· 50 下一页

导航