随笔档案「2019年9月」 - AI数据

JSON和fastjson

摘要：一、JSON 语法规则：数据在名称/值对中数据由逗号分隔花括号保存对象方括号保存数组名称/值对-->对象-->数组 JSON 名称/值对 JSON 数据的书写格式是：名称/值对。名称/值对包括字段名称（在双引号中），后面写一个冒号，然后是值： "firstName" : "John" J 阅读全文

posted @ 2019-09-28 15:43 AI数据阅读(950) 评论(0) 推荐(0)

统计（一）数据与量化

摘要：一、数据是信息点行和列的交叉形成点，行是个体，列是属性 1.从左到右的每一行记录一个个体的若干属性 2.从上往下的每一列记录一个属性（变项）的实况 3.列与行的交汇点是信息点，记录某个体的某属性 4.数据库是关于某些个体某些属性的信息库（矿）二、量化研究只测量某些个体的属性 1.此统计非彼统计阅读全文

posted @ 2019-09-26 18:01 AI数据阅读(1764) 评论(0) 推荐(0)

数据挖掘和机器学习概述

摘要：一、数据挖掘任务数据挖掘常见的六大任务： 1.分类问题 2.聚类问题 3.回归问题 4.关联问题 5.序列问题 6.异常检测二、数据挖掘流程 CRISP-DM：跨行业数据挖掘标准流程各环节的任务与目标预测模型的构建和评分流程六大任务中的分类和回归都属于预测模型的范畴三、预测模型的构建和使阅读全文

posted @ 2019-09-26 14:41 AI数据阅读(2312) 评论(1) 推荐(1)

RPC服务治理框架（一）RPC技术

摘要：一、RPC是什么 remote procedure call：远程过程调用过程就是程序，像调用本地方法一样调用远程的过程 RPC采用Client-Server结构，通过request-response消息模式实现 RMI（remote method invocation）远程方法调用时oop领域中阅读全文

posted @ 2019-09-26 09:56 AI数据阅读(1239) 评论(0) 推荐(0)

数据结构(十二)排序

摘要：一、快速排序已经学过的排序分而治之轴点 pivot：快速排序坏消息：在原始序列中，轴点未必存在... 必要条件：轴点必定已然就位 // 尽管反之不然 derangement： 2 3 4... n 1 特别地：在有序序列中，所有元素皆为轴点；反之依然快速排序就是将所有元素逐个转换为轴点的阅读全文

posted @ 2019-09-25 19:00 AI数据阅读(283) 评论(0) 推荐(0)

数据结构(十一)串

摘要：一、ADT 定义术语 ADT b1串匹配算法评测 b2 蛮力匹配版本一版本2 复杂度 c1KMP算法：从记忆力到预知力蛮力，为何低效很多比对不必进行不变性只要记忆力足够强记忆力转为预知力 c2KMP算法：查询表事先确定t 算法实例模式串，下面是对应的查询表，倒数第三个字符秩为阅读全文

posted @ 2019-09-25 14:39 AI数据阅读(416) 评论(0) 推荐(0)

数据结构(十)优先级队列

摘要：一、需求与动机元素接受访问的次序按照优先级，而非FIFO 场景夜间门诊病情危急的优先治疗多任务调度每个任务都有一个指标，指标都是动态变化的，操作系统总是挑选指标最大的任务交由CPU处理应用、算法与特点问题模式：接口规范纯虚函数 a2基本实现基于向量有序向量基于列表有序列表阅读全文

posted @ 2019-09-25 09:46 AI数据阅读(637) 评论(0) 推荐(0)

数据结构(九)词典

摘要：散列：原理桶bucket：直接存放或间接指向一个词条（即词条的引用）桶数组bucket array/散列表hash table，容量为M，即散列表长度 N < M << R 空间 = O(N+M)=O(N) 定址/杂凑/散列：根据词条的key（未必可比较）直接确定散列表入口散列函数：has 阅读全文

posted @ 2019-09-24 20:21 AI数据阅读(306) 评论(0) 推荐(0)

数据结构(八)高级搜索树

摘要：AVL树是典型的适度平衡的二叉搜索树，为每个节点定义引入平衡因子的指标，平衡银子绝对值小于等于1，虽然和理想平衡相比，已经放松了限制，但条件仍显苛刻，还要在动态调整中保持这种特性。一、伸展树局部性 Locality：刚被访问的数据，极有可能很快地再次被访问，这一现象在信息处理过程中屡见不鲜。 B 阅读全文

posted @ 2019-09-24 16:54 AI数据阅读(913) 评论(0) 推荐(0)

数据结构(七)二叉搜索树

摘要：一、概述 BST继承了二叉树也就是列表结构的特点，也借鉴了有序向量的特点和优势。 BBST平衡二叉搜索树这个子集尤其重要 1.循关键码访问数据项之间，依照各自的关键码彼此区分，call-by-key 条件：关键码之间支持大小比较与相等比对数据集合中的数据项统一地表示和实现为词条entry形式词阅读全文

posted @ 2019-09-23 23:24 AI数据阅读(410) 评论(0) 推荐(0)

C++模板

摘要：一、函数模板我们可能会遇到功能相同，但参数不同，而不得不写大量重载函数，如求绝对值，根据参数是整数还是浮点数而重载函数。这不仅会导致冗余，如果修改算法时，没有各个函数体中同步修改，会造成在同一个系统中，处理同类型的问题，用的算法不一致。解决：使用模板求绝对值问题语法：模板参数表的内容类阅读全文

posted @ 2019-09-23 15:48 AI数据阅读(275) 评论(0) 推荐(0)

Hive速览

摘要：一、概述 Hive由Facebook开源，是一个构建在Hadoop之上的数据仓库工具将结构化的数据映射成表支持类SQL查询，Hive中称为HQL 1.读模式 2.Hive架构 3.使用Hive的原因 Hadoop数据分析的问题： MapReduce实现复杂查询逻辑开发难度大，周期长开发速度无法阅读全文

posted @ 2019-09-23 11:53 AI数据阅读(600) 评论(0) 推荐(0)

Hbase速览

摘要：一、概述理解为hadoop中的key-value存储，数据按列存储，基于HDFS和Zookeeper 1.应用 2.场景适用场景：存储格式：半结构化数据，结构化数据存储，Key-Value存储数据版本：固定集合（多版本），定时删除（TTL）更新：列族结构经常调整写Pattern：高并发写阅读全文

posted @ 2019-09-23 10:08 AI数据阅读(619) 评论(0) 推荐(0)

NLP常用Python开发工具

摘要：一、Numpy NumPy系统是Python的一种开源的数值计算包。包括： 1、一个强大的N维数组对象Array； 2、比较成熟的（广播）函数库； 3、用于整合C/C++和Fortran代码的工具包； 4、实用的线性代数、傅里叶变换和随机数生成函数。 numpy和稀疏矩阵运算包scipy配合使用阅读全文

posted @ 2019-09-22 23:06 AI数据阅读(899) 评论(0) 推荐(0)

Hadoop(三）YARN

摘要：Yet Another Resources Negotiator 从Hadoop2.0版本开始引入YARN，主要功能：集群资源管理系统负责集群的统一管理和调度与客户端交互，处理客户端请求一、基本架构 Master/Slave架构资源管理和节点管理器组成集群的机器启动nodemanager 阅读全文

posted @ 2019-09-22 18:17 AI数据阅读(435) 评论(0) 推荐(0)

Hadoop(二）HDFS

摘要：海量数据处理分而治之核心思想：把数据分发到多个节点移动计算到数据附近计算节点进行本地数据处理优选顺序，次之随机读一、HDFS概述修改，先删除，再重新生成 1.架构 namenode维护着HDFS中存储的文件的元数据，以及每个文件块的列表，以及块所在datanode的信息。nameno 阅读全文

posted @ 2019-09-22 16:23 AI数据阅读(383) 评论(0) 推荐(0)

Flume速览

摘要：Flume是一个分布式的、可靠的、高可用的海量日志采集、聚合和传输的系统。Java实现，插件丰富，模块分明。数据流模型：Source-Channel-Sink 事务机制保证了消息传递的可靠性一、基本组件 Event：消息的基本单位，有header和body组成。header是键值对的形式，bod 阅读全文

posted @ 2019-09-21 19:31 AI数据阅读(555) 评论(0) 推荐(0)

Kafka速览

摘要：一、基本结构三台机器组成的Kafka集群，每台机器启动一个Kafka进程，即Broker 向broker发送消息的客户端是Producer，拉取消息的客户端是Consumer Producer和Consumer都是用户实现的 broker只负责数据存储，不保存任何Producer和Consumer 阅读全文

posted @ 2019-09-21 14:56 AI数据阅读(375) 评论(0) 推荐(0)

分布式消息中间件(二)ActiveMQ

摘要：一、概述 Apache出品，最流行的，能力强劲的开源消息总线。 1.JMS规范 Java消息服务（Java Message Service，即JMS）应用程序接口是一个Java平台中关于面向消息中间件（MOM）的API，用于应用程序之间，或分布式系统中发送消息，进行异步通信。Java消息服务是一个与阅读全文

posted @ 2019-09-21 12:44 AI数据阅读(737) 评论(0) 推荐(0)

分布式消息中间件(一)设计

摘要：中间件 1.概述应用场景单体架构如果一个模块升级，比如订单系统，整个系统都要升级耦合度高，开发困难分布式架构后台由多个系统组成多系统协同处理一个请求可以看成分布式系统系统之间相互调用，用RPC远程调用的方式实现但这样系统之间耦合度相对较高为了解决耦合，实现更强的扩展性架构，分布式阅读全文

posted @ 2019-09-20 13:22 AI数据阅读(1286) 评论(0) 推荐(0)

大数据算法(一)亚线性算法

摘要：来源：大数据算法王宏志一、概述大数据定义：在给定的资源约束下，以大数据为输入，在给定时间约束内可以生成满足给定约束结果的算法。大数据特点：4V 大数据算法可以不是：精确算法内存算法串行算法仅在电子计算机上运行的算法大数据算法不仅是：云计算 MapReduce 大数据分析和挖掘的算阅读全文

posted @ 2019-09-20 11:15 AI数据阅读(3106) 评论(0) 推荐(0)

SparkSQL

摘要：一、概述组件运行机制转 SparkSQL – 从0到1认识Catalyst https://blog.csdn.net/qq_36421826/article/details/81988157 深入研究Spark SQL的Catalyst优化器（原创翻译）更高效查询优化优化：把filte 阅读全文

posted @ 2019-09-19 18:47 AI数据阅读(262) 评论(0) 推荐(0)

MySQL索引

摘要：一、索引概念和分类对数据库表中的一列或者多列的值进行排序的一种结构，旨在提高数据的查询效率。 1.普通索引不需要添加任何限制条件，可以创建在任何数据类型中，由字段本身的完整性约束决定。 2.唯一索引使用unique参数进行设置，该值必须是唯一的。主键是一种特殊的唯一索引。 3.全文索引使用f 阅读全文

posted @ 2019-09-18 23:42 AI数据阅读(211) 评论(0) 推荐(0)

Spark程序设计

摘要：一、Spark编程模型 Spark常规步骤：创建RDD-Scala集合/本地文件并行度3，创建3个partition HDFS 文件被切分成block分布在多个节点上，通过textFile读入机器内存，转为RDD的partition对象。action触发之后，才真物理上去执行。总结外部的数据阅读全文

posted @ 2019-09-18 17:47 AI数据阅读(928) 评论(0) 推荐(0)

Java高并发网络编程(五)Netty应用

摘要：推送系统一、系统设计二、拆包和粘包粘包、拆包表现形式现在假设客户端向服务端连续发送了两个数据包，用packet1和packet2来表示，那么服务端收到的数据可以分为三种，现列举如下：第一种情况，接收端正常收到两个数据包，即没有发生拆包和粘包的现象，此种情况不在本文的讨论范围内。第二种情况阅读全文

posted @ 2019-09-16 18:09 AI数据阅读(1137) 评论(0) 推荐(0)

Java高并发网络编程(四)Netty

摘要：在网络应用开发的过程中，直接使用JDK提供的NIO的API，比较繁琐，而且想要进行性能提升，还需要结合多线程技术。由于网络编程本身的复杂性，以及JDK API开发的使用难度较高，所以在开源社区中，涌现出来了很多对JDK NIO进行封装、增强的网络编程框架，比如Netty、Mina等。一、Nett 阅读全文

posted @ 2019-09-16 15:48 AI数据阅读(990) 评论(0) 推荐(0)

Java高并发网络编程(三)NIO

摘要：从Java 1.4开始，Java提供了新的非阻塞IO操作API，用意是替代Java IO和Java Networking相关的API。 NIO中有三个核心组件： Buffer缓冲区 Channel通道 Selector选择器一、Buffer缓冲区缓冲区本质上是一个可以写入数据的内存块（类似数组）阅读全文

posted @ 2019-09-15 18:04 AI数据阅读(800) 评论(0) 推荐(0)

Java高并发网络编程(二)BIO

摘要：一、阻塞服务器端 sc.accept()会使服务端一直阻塞，直到连接被创建 InputStream也是阻塞的客户端 OutputStream也是阻塞的，写完成之后才会返回当同时启动两个客户端的时候服务器只建立了一个连接，并等待客户端的输入我们在被等待的客户端输入123 服务器收到123，并阅读全文

posted @ 2019-09-15 13:08 AI数据阅读(432) 评论(0) 推荐(0)

Java高并发网络编程(一)

摘要：一、OSI网络七层模型因特网是一个极为复杂的网络，分层有助于我们对网络的理解。分层也是一种标准，为了使不同厂商的计算机能够互相通信，以便在更大范围内建立计算机网络，有必要建立一个国际范围的网络体系结构标准。 ISO组织制定了OSI网络七层模型而因特网只用到了五层低三层：屏蔽底层网络的复杂性阅读全文

posted @ 2019-09-15 10:16 AI数据阅读(1477) 评论(0) 推荐(0)

数据结构(六)图

摘要：术语实现算法一、概述存在对应关系就连边，邻接关系顶点与顶点之间的关系参与定义邻接关系的每个顶点，与这个邻接关系的关系称作关联关系顶点与相关的某条边的关系本章忽略下面这种边无向图/有向图所有边均无方向的图，即无向图undigrapy 反之，有向图digraph中均为有向边direc 阅读全文

posted @ 2019-09-14 16:31 AI数据阅读(743) 评论(0) 推荐(0)

【转载】大数据面试知识图谱

摘要：来源：大数据技术与架构公众号作者：机智的王知先来源：大数据技术与架构公众号作者：机智的王知先场景描述：大数据开发岗位技能树，学习和复习总纲。关键词：面试大数据大纲正所谓，无招胜有招。愿读到这篇文章的技术人早日明白并且脱离技术本身，早登彼岸。一切技术最终只是雕虫小技。大纲本阅读全文

posted @ 2019-09-14 10:06 AI数据阅读(755) 评论(0) 推荐(0)

数据结构(四)二叉树

摘要：一、树 Vector和List都有明显的弱点，都无法兼顾动态和静态操作的高效性。 Tree可以认为将Vector和List的优点结合了起来，可以认为是列表的列表List<List>，半线性结构。应用层次关系的表示从数学上看，树是一类特殊的图，联通无环图。树由一组顶点（vertex）以及连接于阅读全文

posted @ 2019-09-13 21:38 AI数据阅读(706) 评论(0) 推荐(0)

Scala（一）基础

摘要：OOP 面向对象编程 AOP 面向切面编程 FP 函数式编程编程语言都要定义变量，一些代码是用来注释的，变量和变量之间有一些关系，要做一些运算，运算离不开流程控制，进行运算的数据往往来自数据结构，最基本的是数组。所有编程语言的需要：变量注释运算符流程控制数组编码规范：命名、换行、缩进阅读全文

posted @ 2019-09-09 21:33 AI数据阅读(500) 评论(0) 推荐(0)

Java虚拟机(一)

摘要：一、Java发展历程 Java之父，James Gosling博士 JDK Version 1.0 1996-01-23 Oak(橡树) 初代版本，伟大的一个里程碑，但是是纯解释运行，使用外挂JIT，性能比较差，运行速度慢。 JDK Version 1.1 1997-02-19 JDBC(Java 阅读全文

posted @ 2019-09-09 19:11 AI数据阅读(306) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（九）邮件开发

摘要：Java官方支持邮件开发，Javax-mail jdk中默认没有，需要另外下载 apache的基于Javax-mail开发了commons-mail，更加简单高效，推荐使用一、电子邮件接收和发送协议二、Apache-James邮件服务器 1.自己搭建 1）将压缩包解压到非中文无空格路径 2）解决阅读全文

posted @ 2019-09-09 00:41 AI数据阅读(402) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（八）后台页面详细设置

摘要：一、user.jsp改造删除引入菜单抽取导航栏 nav-bar.jsp，删除引入导航栏删除引入main.jsp的到好烂数据库里添加url 报错，url不对没有/ url正确 action="${ctp}/permission/user/login" <a href="${c_menu.ur 阅读全文

posted @ 2019-09-08 21:44 AI数据阅读(969) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（七）后台用户菜单

摘要：mvn命令不能运行： jar-war-pom之间是可以直接写，优先找这个工程，而不是仓库的位置 pom-pom子父关系，需要去仓库中找，我们需要使用<relativePath>../project-parent/pom.xml</relativePath> 在当前的子pom中，指定一下父pom文件在阅读全文

posted @ 2019-09-07 07:29 AI数据阅读(515) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（六）后台用户权限控制

摘要：登陆成功进入控制面板后左侧的菜单是共同的元素，抽取出来做静态包含要求必须是按照不同的用户得到不同的菜单用户做了权限限制，哪个用户能操作哪些内容（链接、按钮、内容）一、RBAC权限模型权限：权利与限制可以做什么和不可以做什么权限管理是大部分软件系统都会涉及的，而且权限管理的需求本质往往是阅读全文

posted @ 2019-09-06 16:50 AI数据阅读(928) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（五）后台用户登录功能

摘要：用户模块 1)注册表单校验，使用校验插件用户密码需要加密存储注册成功后来到管理控制台，将用户放在session中，防止以后获取以后用户经常获取用户id，使用mabatis主键自增策略，保存用户的时候，将自增的主键放在TUser的id属性上实际问题：用户的id不是自增用户分开存储，经常查询阅读全文

posted @ 2019-09-06 13:33 AI数据阅读(815) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（四）后台用户注册功能

摘要：重点：密码加密存储使用jQuery插件做校验和错误提示等密码不能明文存储，在数据库中是加密存储的可逆加密：通过密文使用解密算法得到明文 DES AES 不可逆加密：通过密文，得不到明文 MD5 SHA-1 SHA-2 MD5优点：压缩性，长度固定；容易计算；抗修改性；强抗碰撞；MD5加盐值加阅读全文

posted @ 2019-09-06 01:31 AI数据阅读(806) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（三）第一个网页

摘要：一、bootstrap 本项目采用bootstrap3 bootstrap中文网 https://www.bootcss.com/ 使用bootstrap三步： 1.导入jQuery 2.导入bootstrap自己的css样式 3.导入bootstrap自己的js文件 bootstrap定义了大量的阅读全文

posted @ 2019-09-05 12:55 AI数据阅读(846) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（二）架构搭建之架构测试

摘要：1.dao层和pojo都是使用mbg生成，基本的CRUD以及JavaBean 2.将mbg放在dao层，一旦dao层打包以后mbg就删除掉一、创建数据库用于测试数据库名称：scw_0325 SQL： /* */ /* DBMS name: MySQL 5.0 */ /* Created on: 阅读全文

posted @ 2019-09-04 22:42 AI数据阅读(612) 评论(0) 推荐(0)

【JavaWeb项目】一个众筹网站的开发（一）架构搭建

摘要：本项目是@尚硅谷相关视频的记录。本项目使用Maven构建，工程架构如下图所示：一、公司的公共父工程和工具类包 1.父工程每个公司都有自己的父工程父工程作用：对公司使用的jar包进行统一管理，别的工程需要继承公司的父工程父工程必须是pom 项目的打包类型：pom、jar、war pom > 阅读全文

posted @ 2019-09-04 14:20 AI数据阅读(2340) 评论(0) 推荐(0)

SpringMVC概述

摘要：一、概述最初，Java Web使用JSP+Java Bean的模式，两者之间存在严重的耦合。由于业务逻辑基本是由JSP完成的，Java和HTML也耦合在一起，前后端工作严重依赖和混杂在一起，两者都处理同一个JSP文件，前端等待后端完成，后端等待前端完成，然后才能进行测试，并且JSP很难复用。 JS 阅读全文

posted @ 2019-09-04 14:14 AI数据阅读(222) 评论(0) 推荐(0)

调试Spark应用

摘要：本文摘自：《Hadoop专家-管理、调优与Spark|YARN|HDFS安全》Sam R. Alapati 一、通过日志聚合访问日志二、当日志聚合未开启时阅读全文

posted @ 2019-09-03 18:13 AI数据阅读(194) 评论(0) 推荐(0)

Spark开发环境搭建和作业提交

摘要：Spark高可用集群搭建在所有节点上下载或上传spark文件，解压缩安装，建立软连接配置所有节点spark安装目录下的spark-evn.sh文件配置slaves 配置spark-default.conf 配置所有节点的环境变量 spark-evn.sh 加入 -Dspark.deploy.r 阅读全文

posted @ 2019-09-03 18:10 AI数据阅读(1237) 评论(0) 推荐(0)

【UML】最简单的类图

摘要：Rational Rose简明实用教程 https://blog.csdn.net/gz153016/article/details/49641847 Rational Rose是Rational公司出品的一种面向对象的统一建模语言的可视化建模工具。用于可视化建模和公司级水平软件应用的组件构造。现在阅读全文

posted @ 2019-09-02 23:01 AI数据阅读(1369) 评论(0) 推荐(0)

Spark核心原理初探

摘要：一、运行架构概览 Spark架构是主从模型，分为两层，一层管理集群资源，另一层管理具体的作业，两层是解耦的。第一层可以使用yarn等实现。 Master是管理者进程，Worker是被管理者进程，每个Worker节点启动一个Worker进程，了解每台机器的资源有多少，并将这些信息汇报各Master进程阅读全文

posted @ 2019-09-02 16:00 AI数据阅读(1376) 评论(0) 推荐(0)

09 2019 档案

导航

公告