上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页
摘要: Python List numpy array numpy数组:元素只有一种类型,否则会转换成字符串。 不同的类型,不同的行为 numpy的构造子集 二维numpy数组 ndarray=n维数组 阅读全文
posted @ 2017-02-07 00:19 派。 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 1.安装pip 2.安装机器学习包 下面安装包由于有依赖关系,顺序不能混乱 报错: 执行命令安装g++ 由于天朝的网安装python-dev太慢,所以我对ubuntu更新成国内源。用命令行的形式直接替换/etc/apt/source.list(替换前先备份)文件中的内容,但在sudo apt-get 阅读全文
posted @ 2017-01-15 14:54 派。 阅读(1434) 评论(0) 推荐(0) 编辑
摘要: Ubuntu版本 lh@ubuntu:~/.pip$ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 16.04.1 LTS Release: 16.04 Codename 阅读全文
posted @ 2017-01-14 17:18 派。 阅读(183) 评论(0) 推荐(0) 编辑
摘要: 常用Python机器学习包 Numpy:用于科学计算的包 Pandas:提供高性能,易于使用的数据结构和数据分析工具 Scipy:用于数学,科学工程的软件 StatsModels:用于探索数据、估计统计模型、统计检验 Scikit-learn:提供经典的机器学习算法用于数据挖掘和数据分析 matpl 阅读全文
posted @ 2017-01-14 12:51 派。 阅读(3484) 评论(0) 推荐(0) 编辑
摘要: 1.Wordcount.scala(本地模式) 上述代码是基于IDEA运行的本地模式。 wordcount.txt 运行结果: 2.打成jar上传集群代码 阅读全文
posted @ 2017-01-11 11:02 派。 阅读(240) 评论(0) 推荐(0) 编辑
摘要: 日志: Could not establish connection to jdbc:hive2://192.168.0.51:10000: Required field 'serverProtocolVersion' is unset! Struct:TOpenSessionResp(status 阅读全文
posted @ 2016-12-15 17:23 派。 阅读(4396) 评论(0) 推荐(0) 编辑
摘要: 进入sparksql 执行查询 阅读全文
posted @ 2016-12-02 10:30 派。 阅读(752) 评论(0) 推荐(0) 编辑
摘要: 点部署直接出现如下图: 通过查看日志: tail -f /var/log/ambari-server/ambari-server.log 原因:由于/var/lib/ambari-server/resources/stacks/HDP/2.3/services/YDB/configuration/y 阅读全文
posted @ 2016-12-01 17:52 派。 阅读(301) 评论(0) 推荐(0) 编辑
摘要: 原文件 第一种方法 默认是tab分割。 第二种方法 阅读全文
posted @ 2016-11-30 16:21 派。 阅读(437) 评论(0) 推荐(0) 编辑
摘要: 三种调度器 1.FIFO Scheduler 把应用按提交的顺序排成一个队列,这是一个先进先出队列,在进行资源分配的时候,先给队列中最头上的应用进行分配资源,等最前面的应用需求满足后再给下一个分配,以此类推。不适用于共享集群,大的应用可能会占用所有集群资源,这就导致其它应用被阻塞。 2.Capaci 阅读全文
posted @ 2016-11-26 10:20 派。 阅读(555) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 12 下一页