摘要:
Python List numpy array numpy数组:元素只有一种类型,否则会转换成字符串。 不同的类型,不同的行为 numpy的构造子集 二维numpy数组 ndarray=n维数组 阅读全文
摘要:
1.安装pip 2.安装机器学习包 下面安装包由于有依赖关系,顺序不能混乱 报错: 执行命令安装g++ 由于天朝的网安装python-dev太慢,所以我对ubuntu更新成国内源。用命令行的形式直接替换/etc/apt/source.list(替换前先备份)文件中的内容,但在sudo apt-get 阅读全文
摘要:
Ubuntu版本 lh@ubuntu:~/.pip$ lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 16.04.1 LTS Release: 16.04 Codename 阅读全文
摘要:
常用Python机器学习包 Numpy:用于科学计算的包 Pandas:提供高性能,易于使用的数据结构和数据分析工具 Scipy:用于数学,科学工程的软件 StatsModels:用于探索数据、估计统计模型、统计检验 Scikit-learn:提供经典的机器学习算法用于数据挖掘和数据分析 matpl 阅读全文
摘要:
1.Wordcount.scala(本地模式) 上述代码是基于IDEA运行的本地模式。 wordcount.txt 运行结果: 2.打成jar上传集群代码 阅读全文
摘要:
日志: Could not establish connection to jdbc:hive2://192.168.0.51:10000: Required field 'serverProtocolVersion' is unset! Struct:TOpenSessionResp(status 阅读全文
摘要:
进入sparksql 执行查询 阅读全文
摘要:
点部署直接出现如下图: 通过查看日志: tail -f /var/log/ambari-server/ambari-server.log 原因:由于/var/lib/ambari-server/resources/stacks/HDP/2.3/services/YDB/configuration/y 阅读全文
摘要:
原文件 第一种方法 默认是tab分割。 第二种方法 阅读全文
摘要:
三种调度器 1.FIFO Scheduler 把应用按提交的顺序排成一个队列,这是一个先进先出队列,在进行资源分配的时候,先给队列中最头上的应用进行分配资源,等最前面的应用需求满足后再给下一个分配,以此类推。不适用于共享集群,大的应用可能会占用所有集群资源,这就导致其它应用被阻塞。 2.Capaci 阅读全文