摘要: 首语:之前第一位带我的师傅说没有SQL实现不了的功能,现在Flink SQL火了之后我觉得他说的有道理,复习下hive SQL吧,毕竟咱也是hive小王子啊hahahaha hive的最新学习资料:http://www.cnblogs.com/qingyunzong/p/8707885.html h 阅读全文
posted @ 2019-04-20 22:58 akia开凯 阅读(412) 评论(0) 推荐(0) 编辑
摘要: 一、sklearn中自带的回归算法 1. 算法 来自:https://my.oschina.net/kilosnow/blog/1619605 另外,skilearn中自带保存模型的方法,可以把训练完的模型在本地保存成.m文件,方法如下: skilearn保存模型方法 keras也可以把模型保存成. 阅读全文
posted @ 2019-04-20 22:51 akia开凯 阅读(4587) 评论(0) 推荐(0) 编辑
摘要: 1. %n$s %n$s:代表输出的是字符串,n表示使用第n个参数 2. [0-9]+ [0-9]+代表匹配1个或更多数字,[0-9]与\d是指匹配数字,+是一个或多个 3. \s+ s+代表匹配任何空白字符,包括空格、制表符、换页符等等 4. ^和$ ^代表以...开头,$代表以...结尾 2. 阅读全文
posted @ 2019-04-20 22:49 akia开凯 阅读(104) 评论(0) 推荐(0) 编辑
摘要: 一、常用命令 🧵🧵more(尽量少用vim查看) 类似 cat ,cat命令是将整个文件的内容一页一页的显示,推荐查看文件用more,一个百度大佬说过vim打开极大的文件会把机器卡掉,所以不要养成这种习惯 🧵🧵curl命令 主要是利用URL在命令行下进行文件传输工具,语法: 1 curl [ 阅读全文
posted @ 2019-04-20 22:46 akia开凯 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 1、连续多个文献引用 2、MathType分章符 3、天朝文献格式GB T7714-2005 4、Office安装过程的一些问题 Office2010安装需要MSXML版本 5、Matlab2012a安装 Matlab 2012(R2012a)安装步骤+破解方法 6、Matlab2015b安装 MA 阅读全文
posted @ 2019-04-20 22:42 akia开凯 阅读(421) 评论(2) 推荐(1) 编辑
摘要: 一、硬件可靠性的一些概念 (1)MTTF-平均失效时间或平均失效前时间 该指标针对不可修复系统而言的 (2)连续寿命分布和离散寿命分布 离散寿命分布即以离散变量描述寿命,例如开关开关次数; 连续寿命分布有:指数分布、韦伯尔分布等,源自《可靠性工程基础》 (3)失效率函数、失效概率密度函数、累积失效率 阅读全文
posted @ 2019-04-20 22:40 akia开凯 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 一、参数检验和非参数检验 参数检验是利用总体分布和样本信息对总体参数做出推断,常用的假设检验方法有U检验法、T检验法、χ2检验法(卡方检验)、F检验法等; 非参数检验是利用样本信息对总体分布做出推断,常用的假设检验方法有卡方检验、二项分布检验、K-S检验以及变量值随机性检验等。 二、点估计和区间估计 阅读全文
posted @ 2019-04-20 22:39 akia开凯 阅读(157) 评论(0) 推荐(0) 编辑
只有注册用户登录后才能阅读该文。 阅读全文
posted @ 2019-04-20 22:34 akia开凯 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 1.kafka是什么? kafka最初是Linkedin公司,scala开发的一个分布式发布-订阅消息中间件,后来成为Apache项目之一,它的作用是解耦、异步、并发、缓冲。 解耦:生产者和消费者不用关心彼此具体的实现,只针对kafka中数据编程即可; 异步:生产者往kafka中生产一条数据,消费者 阅读全文
posted @ 2019-04-20 22:31 akia开凯 阅读(418) 评论(0) 推荐(0) 编辑
摘要: 1. 离线计算是什么? 离线计算:批量获取数据、批量传输数据、周期性批量计算数据、数据展示 代表技术:Sqoop批量导入数据、HDFS批量存储数据、MapReduce批量计算数据、Hive批量计算数据、Azkaban任务调度。 2. 流式计算是什么? 流式计算:数据实时产生、数据实时传输、数据实时计 阅读全文
posted @ 2019-04-20 22:08 akia开凯 阅读(248) 评论(0) 推荐(0) 编辑