zhangqi0828 - 博客园

2019年5月8日

sudo: /etc/sudoers is world writable|给用户添加权限报错

摘要：给用户添加权限时候出现:sudo: /etc/sudoers is world writable| sudo: /etc/sudoers is world writable解决方式：阅读全文

posted @ 2019-05-08 11:32 zhangqi0828 阅读(2832) 评论(0) 推荐(0) 编辑

2019年5月5日

锁定文件失败打不开磁盘“D:\vms\S1\CentOS 64 位.vmdk”或它所依赖的某个快照磁盘(强制关机后引起的问题)

摘要：电脑强制关机后，centos系统启动失败，报异常：锁定文件失败打不开磁盘“D:\vms\S1\CentOS 64 位.vmdk”或它所依赖的某个快照磁盘。解决办法：进入D:\vms\S1目录，删除下图的两个文件夹：转自:https://blog.csdn.net/qq_34896163/arti 阅读全文

posted @ 2019-05-05 17:21 zhangqi0828 阅读(2090) 评论(0) 推荐(0) 编辑

2019年5月4日

hadoop退出安全模式Name node is in safe mode

摘要：在使用 hdfs 的时候出现如下错误： 18/01/12 09:04:34 INFO fs.TrashPolicyDefault: Namenode trash configuration: Deletion interval = 0 minutes, Emptier interval = 0 mi 阅读全文

posted @ 2019-05-04 07:17 zhangqi0828 阅读(484) 评论(0) 推荐(0) 编辑

2019年5月1日

spark启动后出现“JAVA_HOME not set” 异常和"org.apache.hadoop.security.AccessControlException"异常

摘要： /home/bigdata/hadoop/spark-2.1.1-bin-hadoop2.7/sbin/start-all.sh 启动后执行jps命令，主节点上有Master进程，其他子节点上有Work进行，登录Spark管理界面查看集群状态（主节点）：http://master01:8080/ 到阅读全文

posted @ 2019-05-01 11:50 zhangqi0828 阅读(307) 评论(0) 推荐(0) 编辑

2019年4月27日

api-ms-win-crt-runtimel1-1-0.dll缺失的终极解决方案

摘要： https://blog.csdn.net/lt_java13/article/details/78814676 阅读全文

posted @ 2019-04-27 19:35 zhangqi0828 阅读(286) 评论(0) 推荐(0) 编辑

pip升级

摘要：只要出现报错：python -m pip install --upgrade pip。都表示需要进行升级pip版本查看pip版本：pip -V（pip可能是python2版本或python3版本）升级pip版本：阅读全文

posted @ 2019-04-27 19:28 zhangqi0828 阅读(1175) 评论(0) 推荐(0) 编辑

2019年4月26日

Spark的转化和行动（transformations和action）

摘要： //********************** 装换操作 ********************* 1、def map[U: ClassTag](f: T => U): RDD[U] 将函数应用于RDD的每一元素，并返回一个新的RDD 2、def filter(f: T => Boolean): 阅读全文

posted @ 2019-04-26 20:29 zhangqi0828 阅读(256) 评论(0) 推荐(0) 编辑

RDD的概念与创建

摘要： 1、RDD是整个Spark的计算基石。是分布式数据的抽象，为用户屏蔽了底层复杂的计算和映射环境 RDD是不可变的，如果需要在一个RDD上进行转换操作，则会生成一个新的RDD RDD是分区的，RDD里面的具体数据是分布在多台机器上的Executor里面的。堆内内存和堆外内存 + 磁盘。 RDD是弹性的阅读全文

posted @ 2019-04-26 20:26 zhangqi0828 阅读(669) 评论(0) 推荐(0) 编辑

2019年4月23日

Akka详细介绍

摘要： AKKA NOTES - 介绍演员任何在过去做过多线程的人都不会否认管理多线程应用程序有多么困难和痛苦。我说管理因为它开始很简单，一旦你开始看到性能改进，它变得非常有趣。但是，当您发现没有更简单的方法从子任务中的错误中恢复或者您发现难以重现的僵尸错误或者当您的探查器显示您的线程花费大量时间阻塞时，阅读全文

posted @ 2019-04-23 19:39 zhangqi0828 阅读(592) 评论(0) 推荐(0) 编辑

2019年4月22日

列举spark所有算子

摘要：一、RDD概述 1、什么是RDD RDD（Resilient Distributed Dataset）叫做弹性分布式数据集，是Spark中最基本的数据抽象，它代表一个不可变、可分区、里面的元素可并行计算的集合。RDD具有数据流模型的特点：自动容错、位置感知性调度和可伸缩性。RDD允许用户在执行多个查阅读全文

posted @ 2019-04-22 16:04 zhangqi0828 阅读(1909) 评论(0) 推荐(0) 编辑

zhangqi

be a coder

公告