摘要:
一、数据湖技术与数据仓库的区别 数据湖是一个存储企业各种原始数据的大型仓库,支持对任意规模的结构化、半结构化和非结构化数据进行集中式存储,数据按照原有结构进行存储,无须进行结构化处理;数据湖中的数据可供存取、处理、分析及传输,支撑大数据处理、实时分析、机器学习、数据可视化等多种应用,最终支持企业的智 阅读全文
摘要:
我们要非常的清楚,所有的切分调整,都是对相关人的利益的调整。为什么这么说呢,因为维护自己的利益,是每个人的本性,是在骨子里面的,我们不能逃避这一点。我们以第一篇文章里面的例子为例来做解释。 我们已经知道,随着社会的发展,分工是必然的,为什么呢? 这个背后的动力就是每个人自己的利益。每个人都希望能够把 阅读全文
摘要:
首先是乐高这一章节。这是代码复用的概念,这会省去编写代码的麻烦,但是也存在不少问题,诸如大型可复用组件的稀少,有些程序员不愿拾人牙慧等等。其实我认为这是一个不错的设想,也是一个值得努力的方向。因为许多时候我们去编写那些人所共知的代码是一种时间上的浪费,我们应花更多的时间创新代码,或在已有的代码部件中 阅读全文
摘要:
这是代码复用的概念,这会省去编写代码的麻烦,但是也存在不少问题,诸如大型可复用组件的稀少,有些程序员不愿拾人牙慧等等。其实我认为这是一个不错的设想,也是一个值得努力的方向。因为许多时候我们去编写那些人所共知的代码是一种时间上的浪费,我们应花更多的时间创新代码,或在已有的代码部件中创造出新的组合。这一 阅读全文
摘要:
Tensorflow安装 说在前面 1、安装tensorflow是基于Python的,并且需要从Anaconda仓库中下载。 2、所以我们的步骤是:先下载Anaconda,再在Anaconda中安装一个Python,(你的电脑里可能本来已经装了一个Python环境,但是Anaconda中的Pytho 阅读全文
摘要:
写在前面 首先Anaconda这款软件是在国外的,不论是软件的下载速度,还是使用软件下载包的速度都是很慢的,我们需要配置中国的镜像源进行加速。 一、Anaconda的安装 我们使用的是清华镜像源下载Anaconda的安装包,网址: https://mirrors.tuna.tsinghua.edu. 阅读全文
摘要:
一、基础环境 1、安装好neo4j 2、官网地址:https://neo4j.com/download-center/ 二、实验37-使用neo4j工具导入知识图谱操作步骤 1、安装neo4j并创建相应环境变量 启动输入neo4j.bat console 2、进入网址http://localhost 阅读全文
摘要:
一、概论 软件工程的三要素。 软件工程以关注软件质量为目标,包括过程、方法和工具三个要素 过程:支持软件生命周期的所有活动 方法:为软件开发过程提供“如何做”的技术 工具:为软件开发方法提供自动的或半自动的软件支撑环境 软件过程的定义。 软件过程是用于软件开发及维护的一系列活动、方法及实践。 软件工 阅读全文
摘要:
软件质量属性之可用性及其战术分析 董奥 (石家庄铁道大学,河北省石家庄市,050043) 摘 要 架构设计的目标应当为满足架构需求的质量属性寻找适当的战术,质量需求指定了软件的响应,以实现业务目标。我们感兴趣的是设计使用设计模式、架构模式或架构策略创建设计的“战术”。 以可用性为例,我们在评测软件质 阅读全文
摘要:
1、可用性 可用性是指系统能正常为用户提供服务的时间比例。可用性与系统故障及其相关后果有关。当系统不再提供其规范中所说明的服务时,就出现了系统故障。 场景设想:双十一狂欢节时很多用户同时访问淘宝网,导致系统崩溃 刺激源:用户 刺激:很多用户同时进行登录、查询、购买操作 环境:用户正常操作 制品:系统 阅读全文
摘要:
本篇博客为阅读王概凯的 架构漫谈九篇博客总结而出,原文地址:https://www.infoq.cn/profile/1279517/publish/all 如何定义架构?如何利用架构知识完成工作学习上的需求?又应该怎样做好一个架构师呢? 什么是架构呢?架构是人类发展过程中,由被动的认识世界,变成主 阅读全文
摘要:
一、卷积神经网络思想 1、简介 卷积神经网络广泛使用于计算机视觉领域,主要用于提取图片的特征图(feature map)。不同于数学中的卷积,这里的卷积指的是对矩阵的一种运算方式(本质上就是离散化的数学卷积),使用卷积核对图片矩阵进行操作,可以减少图片的位置信息,增加图片的通道信息,从而得到高层语义 阅读全文
摘要:
一、SparkStreaming 介绍 1、批量计算 和 流计算 首先我们要知道什么是 SparkStreaming。先了解两个概念,批量计算 和 流计算。 批量计算 流计算 两者区别: 1.批量计算也叫做离线计算,数据是由边界的,无论多大,总之是有大小的 2.流计算的数据是不断产生的 3.批量计算 阅读全文
摘要:
1、DataFrameReader SparkSQL 的一个非常重要的目标就是完善数据读取,所以SparkSQL 中增加了一个新的框架,专门用于读取外部数据源,叫做DataFrameReader。 例如:通过代码 val reader: DataFrameReader = spark.read 可以 阅读全文
摘要:
一、DataFrame 1、DataFrame是什么 DataFrame 是SparkSQL中一个表示关系型数据库中表的函数式抽象,其作用是让Spark 处理大规模结构化数据的时候更加容易.一般DataFrame可以处理结构化的数据,或者是半结构化的数据,因为这两类数据中都可以获取到Schema信息 阅读全文