08 2016 档案
摘要:题目:反转字符串 Write a function that takes a string as input and returns the string reversed. Example:Given s = "hello", return "olleh". 五种解法: 耗时56ms 耗时52ms
阅读全文
摘要:数据科学问题的类型有如下6种: 1.Descriptive描述性分析,仅仅描述数据展现了那些内容,无需任何解释 2.Exploratory探索性分析,发现未知的关系(不一定正确或有用) 3.Inferential推断性分析,在少量观察的基础上,将得到的信息进行归纳、外推到更大的群体。 4.Predi
阅读全文
摘要:小型数据库:access、foxbase 中型数据库:mysql、sql server、informix 大型数据库:sybase、oracle、db2 如何选取适合的数据库: 项目的规模:负载量多大、用户多大;成本;安全性 DBA认证(数据库管理员) sys用户是超级用户,具有最高权限,默认密码m
阅读全文
摘要:挖掘的复杂数据类型: 时间序列的相似性搜索、时间序列的回归和趋势分析 对于相似性搜索,通常需要先对时间序列进行数据或维度归约和变换。典型的归约技术有:1)离散傅里叶变换 2)离散小波变换 3)基于主成份分析的奇异值分解 序列分为三类:1)基于特征的分类 把序列转换成特征向量,然后使用传统的分类方法;
阅读全文
摘要:创建用户并获取root权限 http://www.cnblogs.com/wangkongming/p/3639425.html 参考上博客,我的具体执行如下: 用xshell连接服务器(在红勾处填写服务器地址,后续就很简单了) 连接成功后默认是root用户,先来创建普通用户并给其赋root权限 这
阅读全文
摘要:随机梯度下降能更快地达到较大的对数似然值,但噪声更大 Explore the effects of step sizes on stochastic gradient ascent(步长对随机梯度上升的影响) 步长太小,收敛速度太慢;步长较大,震荡较大;步长异常大,不收敛
阅读全文
摘要:标题 列表 无序列表 -或* 有序列表 1. 引用 在文本前加入> 图片和链接 代码框 用两个'把中间的代码包裹起来 分割线 另起一行,连续输入三个星号*** 参考资料 http://write.blog.csdn.net/mdeditor
阅读全文
摘要:频繁模式是指频繁的出现在数据集中的模式(如项集、子序列或子结构) 规则兴趣度的两种度量:支持度(所发现规则的有用性)和置信度(所发现规则的确定性) 关联规则的挖掘分以下两步: 1)找出所有的频繁项集 2)由频繁项集产生强关联规则 第二步的开销远小于第一步,因此挖掘关联规则的总体性能由第一步决定 先验
阅读全文
摘要:高质量数据建模的基本流程 概念模型确定系统边界,确定哪些做哪些不做 基本概念:实体、属性、域、关系、键、约束 实体 六合分析法:5W1H Who通常指与企业业务紧密联系的人员和组织 What通常指企业业务相关的“事”等 When更多的时候是以属性的模式出现的,而作为实体更多是以时间表的形式存在 Wh
阅读全文