03 2017 档案

摘要:36大数据: 白话机器学习 http://www.36dsj.com/archives/78385 基于Hadoop的数据仓库Hive 基础知识(写的很好) http://www.36dsj.com/archives/77993 各种编程语言的深度学习库整理-机器学习-about云开发 http:/ 阅读全文
posted @ 2017-03-24 16:10 最最么么哒 阅读(254) 评论(0) 推荐(0) 编辑
摘要:今天看到两个没有见过的SQL中的函数,总结一下; 函数参数:lpad( string1, padded_length, [ pad_string ] ) 其中 string1:源字符串 padded_length: 即最终结果返回的字符串的长度;如果最终返回的字符串的长度比源字符串的小,那么此函数实 阅读全文
posted @ 2017-03-24 10:16 最最么么哒 阅读(18520) 评论(0) 推荐(0) 编辑
摘要:case后可以加入条件在写when,length(String) 为string的字符长度 length(),括号里不仅可以是string的字符串,还可以可是int类型的,但是不可以是bigint类型的 阅读全文
posted @ 2017-03-23 14:40 最最么么哒 阅读(155) 评论(0) 推荐(0) 编辑
摘要:让你真正明白spark streaminghttp://www.aboutyun.com/forum.php?mod=viewthread&tid=21141(出处: about云开发) 阅读全文
posted @ 2017-03-22 22:37 最最么么哒 阅读(194) 评论(0) 推荐(0) 编辑
摘要:由于本人有收集癖,虽然收集了之后不怎么看,但还是喜欢收集,说不定哪天想看了呢。。 这里总结几个常见的比较不错的大数据相关的学习、交流网站,后期会不定时更新,欢迎大家提供建议。 没有先后顺序! 1、36大数据 2、JSON在线格式化工具网站 阅读全文
posted @ 2017-03-22 15:15 最最么么哒 阅读(867) 评论(0) 推荐(1) 编辑
摘要:Oracle TRIM函数是很常见的函数,下面对Oracle TRIM函数的语法作了详尽的阐述说明,希望可以让您对Oracle TRIM函数有更深的认识。 如果提到Oracle TRIM函数,最简单的功能就是使用它来去除字符串的行首和行尾的空格,这个功能也是大家使用频率最高的一种。然而Oracle 阅读全文
posted @ 2017-03-21 16:35 最最么么哒 阅读(25489) 评论(0) 推荐(0) 编辑
摘要:原文链接:http://www.cnblogs.com/liuzhendong/archive/2011/10/27/2226805.html 1.笛卡尔积(Cartesian product) 顾名思义, 这个概念得名于笛卡儿. 在数学中,两个集合 X 和 Y 的笛卡儿积(Cartesian pr 阅读全文
posted @ 2017-03-15 13:57 最最么么哒 阅读(464) 评论(0) 推荐(0) 编辑
摘要:我们要做到不但会写SQL,还要做到写出性能优良的SQL语句。(1)选择最有效率的表名顺序(只在基于规则的优化器中有效): Oracle的解析器按照从右到左的顺序处理FROM子句中的表名,FROM子句中写在最后的表(基础表 driving table)将被最先处理,在FROM子句中包含多个表的情况下, 阅读全文
posted @ 2017-03-13 14:51 最最么么哒 阅读(984) 评论(0) 推荐(0) 编辑
摘要:更新一下: Oracle中row_number()、rank()、dense_rank() 的区别 链接:https://www.cnblogs.com/qiuting/p/7880500.html Oracle中row_number()、rank()、dense_rank() 的区别 链接:htt 阅读全文
posted @ 2017-03-07 22:33 最最么么哒 阅读(299) 评论(0) 推荐(0) 编辑
摘要:##numpy函数库中一些常用函数的记录 最近才开始接触Python,python中为我们提供了大量的库,不太熟悉,因此在《机器学习实战》的学习中,对遇到的一些函数的用法进行记录。 (1)mat( ) numpy函数库中存在两种不同的数据类型(矩阵matrix和数组array),都可以用于处理行列表 阅读全文
posted @ 2017-03-06 17:53 最最么么哒 阅读(5837) 评论(0) 推荐(1) 编辑
摘要:1.tile函数: tile函数是模板numpy.lib.shape_base中的函数。函数的形式是tile(A,reps) A的类型几乎所有类型都可以:array, list, tuple, dict, matrix以及基本数据类型int, string, float以及bool类型。 reps的 阅读全文
posted @ 2017-03-06 17:32 最最么么哒 阅读(10065) 评论(0) 推荐(1) 编辑
摘要:数据挖掘十大经典算法 一、 C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; 2) 在树构造过程中进 阅读全文
posted @ 2017-03-06 16:58 最最么么哒 阅读(2687) 评论(0) 推荐(0) 编辑
摘要:# -*- coding: utf-8 -*-"""Created on Wed Mar 1 10:53:48 2017 @author: LIDEHUA424""" import pandas as pdimport statsmodels.api as smimport pylab as pli 阅读全文
posted @ 2017-03-02 17:52 最最么么哒 阅读(343) 评论(0) 推荐(0) 编辑
摘要:当初学 Python 时,想要弄懂 Python 的错误信息的含义可能有点复杂。这里列出了常见的的一些让你程序 crash 的运行时错误。 1)忘记在 if , elif , else , for , while , class ,def 声明末尾添加 :(导致 “SyntaxError :inva 阅读全文
posted @ 2017-03-01 16:53 最最么么哒 阅读(425) 评论(0) 推荐(0) 编辑