08 2016 档案

摘要:题目:反转字符串 Write a function that takes a string as input and returns the string reversed. Example:Given s = "hello", return "olleh". 五种解法: 耗时56ms 耗时52ms 阅读全文
posted @ 2016-08-26 22:56 python挖掘 阅读(272) 评论(0) 推荐(0) 编辑
摘要:数据科学问题的类型有如下6种: 1.Descriptive描述性分析,仅仅描述数据展现了那些内容,无需任何解释 2.Exploratory探索性分析,发现未知的关系(不一定正确或有用) 3.Inferential推断性分析,在少量观察的基础上,将得到的信息进行归纳、外推到更大的群体。 4.Predi 阅读全文
posted @ 2016-08-20 12:09 python挖掘 阅读(191) 评论(0) 推荐(0) 编辑
摘要:小型数据库:access、foxbase 中型数据库:mysql、sql server、informix 大型数据库:sybase、oracle、db2 如何选取适合的数据库: 项目的规模:负载量多大、用户多大;成本;安全性 DBA认证(数据库管理员) sys用户是超级用户,具有最高权限,默认密码m 阅读全文
posted @ 2016-08-16 17:52 python挖掘 阅读(244) 评论(0) 推荐(0) 编辑
摘要:挖掘的复杂数据类型: 时间序列的相似性搜索、时间序列的回归和趋势分析 对于相似性搜索,通常需要先对时间序列进行数据或维度归约和变换。典型的归约技术有:1)离散傅里叶变换 2)离散小波变换 3)基于主成份分析的奇异值分解 序列分为三类:1)基于特征的分类 把序列转换成特征向量,然后使用传统的分类方法; 阅读全文
posted @ 2016-08-16 11:03 python挖掘 阅读(287) 评论(0) 推荐(0) 编辑
摘要:创建用户并获取root权限 http://www.cnblogs.com/wangkongming/p/3639425.html 参考上博客,我的具体执行如下: 用xshell连接服务器(在红勾处填写服务器地址,后续就很简单了) 连接成功后默认是root用户,先来创建普通用户并给其赋root权限 这 阅读全文
posted @ 2016-08-15 16:43 python挖掘 阅读(130) 评论(0) 推荐(0) 编辑
摘要:随机梯度下降能更快地达到较大的对数似然值,但噪声更大 Explore the effects of step sizes on stochastic gradient ascent(步长对随机梯度上升的影响) 步长太小,收敛速度太慢;步长较大,震荡较大;步长异常大,不收敛 阅读全文
posted @ 2016-08-15 11:57 python挖掘 阅读(277) 评论(0) 推荐(0) 编辑
摘要:标题 列表 无序列表 -或* 有序列表 1. 引用 在文本前加入> 图片和链接 代码框 用两个'把中间的代码包裹起来 分割线 另起一行,连续输入三个星号*** 参考资料 http://write.blog.csdn.net/mdeditor 阅读全文
posted @ 2016-08-12 16:51 python挖掘 阅读(149) 评论(0) 推荐(0) 编辑
摘要:频繁模式是指频繁的出现在数据集中的模式(如项集、子序列或子结构) 规则兴趣度的两种度量:支持度(所发现规则的有用性)和置信度(所发现规则的确定性) 关联规则的挖掘分以下两步: 1)找出所有的频繁项集 2)由频繁项集产生强关联规则 第二步的开销远小于第一步,因此挖掘关联规则的总体性能由第一步决定 先验 阅读全文
posted @ 2016-08-11 16:14 python挖掘 阅读(1015) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2016-08-10 15:24 python挖掘 阅读(118) 评论(0) 推荐(0) 编辑
摘要:高质量数据建模的基本流程 概念模型确定系统边界,确定哪些做哪些不做 基本概念:实体、属性、域、关系、键、约束 实体 六合分析法:5W1H Who通常指与企业业务紧密联系的人员和组织 What通常指企业业务相关的“事”等 When更多的时候是以属性的模式出现的,而作为实体更多是以时间表的形式存在 Wh 阅读全文
posted @ 2016-08-04 17:14 python挖掘 阅读(2369) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示