摘要: Spark Streaming支持实时数据流的可扩展(scalable)、高吞吐(high-throughput)、容错(fault-tolerant)的流处理(stream processing)。 架构图 特性如下: 可线性伸缩至超过数百个节点; 实现亚秒级延迟处理; 可与Spark批处理和交互 阅读全文
posted @ 2020-06-24 11:56 萨姆大叔 阅读(640) 评论(0) 推荐(0) 编辑
摘要: 一、编程环境 以下为Mac系统上单机版Spark练习编程环境的配置方法。 注意:仅配置练习环境无需安装Hadoop,无需安装Scala。 1,安装Java8 注意避免安装其它版本的jdk,否则会有不兼容问题。 https://www.oracle.com/technetwork/java/javas 阅读全文
posted @ 2020-06-24 11:10 萨姆大叔 阅读(305) 评论(0) 推荐(0) 编辑
摘要: 一、Spark优势特点 作为大数据计算框架MapReduce的几人者,Spark具备一下优势特性。 1 高效性 不同于MapReduce将中间计算结果放入磁盘中,Spark采用内存存储中间计算结果,减少了迭代运算的磁盘IO,并通过并行计算DAG图的优化,减少了不同任务之间的依赖,降低了延迟等待时间。 阅读全文
posted @ 2020-06-24 09:56 萨姆大叔 阅读(599) 评论(0) 推荐(0) 编辑
摘要: 一、注解(annotations)列表 @SpringBootApplication:包含了@ComponentScan、@Configuration和@EnableAutoConfiguration注解。 其中@ComponentScan让spring Boot扫描到Configuration类并 阅读全文
posted @ 2020-04-10 13:00 萨姆大叔 阅读(2231) 评论(0) 推荐(0) 编辑
摘要: 在单位内架设的Web系统,如果使用CAS作为单点登录方案,往往会遇到从单位的不同网络(例如双网隔离下的外网和内网)访问时,系统无法正常登录使用的问题。基于本人实践,本文介绍一些解决方案。 技术背景 对CAS很熟悉的朋友可以跳过本章。 用Java开发一个支持单点登录SSO的Web应用,一般都需要部署两 阅读全文
posted @ 2020-03-31 14:49 萨姆大叔 阅读(1904) 评论(0) 推荐(1) 编辑
摘要: 二、基本概念 1 有监督学习与无监督学习 根据样本数据是否带有标签值,可以将机器学习算法分成有监督学习和无监督学习两类。有监督学习的样本数据带有标签值,它从训练样本中学习得到一个模型,然后用这个模型对新的样本进行预测推断。有监督学习的典型代表是分类问题和回归问题。 无监督学习对没有标签的样本进行分析 阅读全文
posted @ 2019-12-23 15:56 萨姆大叔 阅读(805) 评论(0) 推荐(0) 编辑
摘要: 一、列举常用的最优化方法 梯度下降法 牛顿法, 拟牛顿法 坐标下降法 梯度下降法的改进型如AdaDelta,AdaGrad,Adam,NAG等。 2梯度下降法的关键点 梯度下降法沿着梯度的反方向进行搜索,利用了函数的一阶导数信息。梯度下降法的迭代公式为: 根据函数的一阶泰勒展开,在负梯度方向,函数值 阅读全文
posted @ 2019-12-23 15:02 萨姆大叔 阅读(1512) 评论(0) 推荐(0) 编辑
摘要: RPC非常重要,很多人面试的时候都挂在了这个地方!你要是还不懂RPC是什么?他的基本原理是什么?你一定要把下边的内容记起来!好好研究一下!特别是文中给出的一张关于RPC的基本流程图,重点中的重点,Dubbo RPC的基本执行流程就是他,RPC框架的基本原理也是他,别说我没告诉你!看了下边的内容你要掌 阅读全文
posted @ 2019-09-20 09:20 萨姆大叔 阅读(12004) 评论(0) 推荐(0) 编辑
摘要: 分析和解决问题: 1.重起数据库: C:\Documents and Settings\Jacken>sqlplus /nologSQL> conn sys/123456 as sysdba;SQL> shutdown immediate;数据库已经关闭。已经卸载数据库。ORACLE 例程已经关闭。 阅读全文
posted @ 2019-08-14 13:16 萨姆大叔 阅读(20830) 评论(0) 推荐(0) 编辑
摘要: 当磁盘大小超过标准时会有报警提示,这时如果掌握df和du命令是非常明智的选择。 df可以查看一级文件夹大小、使用比例、档案系统及其挂入点,但对文件却无能为力。 du可以查看文件及文件夹的大小。 两者配合使用,非常有效。比如用df查看哪个一级目录过大,然后用df查看文件夹或文件的大小,如此便可迅速确定 阅读全文
posted @ 2019-08-07 13:06 萨姆大叔 阅读(7230) 评论(0) 推荐(0) 编辑