上一页 1 2 3 4 5 6 ··· 11 下一页
摘要: 阅读全文
posted @ 2016-08-10 15:24 python挖掘 阅读(118) 评论(0) 推荐(0) 编辑
摘要: 高质量数据建模的基本流程 概念模型确定系统边界,确定哪些做哪些不做 基本概念:实体、属性、域、关系、键、约束 实体 六合分析法:5W1H Who通常指与企业业务紧密联系的人员和组织 What通常指企业业务相关的“事”等 When更多的时候是以属性的模式出现的,而作为实体更多是以时间表的形式存在 Wh 阅读全文
posted @ 2016-08-04 17:14 python挖掘 阅读(2358) 评论(1) 推荐(0) 编辑
摘要: 参看博文http://www.tuicool.com/articles/2qYjuy 逻辑回归的输出范围是[0,1],根据概率值来判断因变量属于0还是属于1 实现过程分三步: indicated function指示函数 阅读全文
posted @ 2016-07-31 15:55 python挖掘 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 有这么一个问题,说我在看一篇文章,觉得不错,想要从书架的众多书籍中找相类似的文章来继续阅读,这该怎么办? 于是我们想到暴力解决法,我一篇一篇的比对,找出相似的 最近邻的概念很好理解,我们通过计算知道了每一篇文章和目标文章的距离,选择距离最小的那篇作为最相近的候选文章或者距离最小的一些文章作为候选文章 阅读全文
posted @ 2016-07-30 16:49 python挖掘 阅读(1408) 评论(0) 推荐(0) 编辑
摘要: 检索是什么,有什么用? 检索是指从文献资料、网络信息等信息集合中查找到自己需要的信息或资料的过程,在信息冗余的时代,高效的检索显得越发重要。 比如说我们如何从众多图片中找到和自家小狗相似的小狗的图片 如何从众多产品中找到我们想要购买的按摩椅 如何从众多电影/歌曲/电视节目中找到我们喜欢的 如何从新闻 阅读全文
posted @ 2016-07-30 15:51 python挖掘 阅读(184) 评论(0) 推荐(0) 编辑
摘要: 集中式VS分布式 集中式是指所有资源都存储在中央服务器上,所有客户端必须在连接服务器的前提下才能进行查询修改等操作 分布式是指每个终端都有一份完整的资源副本,可以在本地随意修改查询,只需要不定时的与远端交换中心进行交流以提交或获取最新版本 分布式优点: 充分利用“三个臭皮匠赛过诸葛亮”思想,具有较高 阅读全文
posted @ 2016-07-30 10:48 python挖掘 阅读(91) 评论(0) 推荐(0) 编辑
摘要: The goal of this first notebook is to explore logistic regression and feature engineering目标是探索逻辑回归和特征工程 In this notebook you will use product review d 阅读全文
posted @ 2016-07-29 12:19 python挖掘 阅读(443) 评论(0) 推荐(0) 编辑
摘要: Welcome! Linear Classifiers & Logistic Regression 测验: Linear Classifiers & Logistic Regression 测验: Linear Classifiers & Logistic Regression 测验: Predic 阅读全文
posted @ 2016-07-27 18:53 python挖掘 阅读(181) 评论(0) 推荐(0) 编辑
摘要: 本课程共有七周的学习安排: week1 Welcome引子 week2 Learning Linear Classifiers线性分类 week3 Decision Trees决策树 week4 Preventing Overfitting in Decision Trees防止过拟合 week5 阅读全文
posted @ 2016-07-27 11:47 python挖掘 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 在做分类时常常需要估算不同样本之间的相似性,通常采用的方法就是计算样本间的距离。 常用的有: 欧氏距离:源于欧式空间中两点的距离公式,np.outer(计算内积) 曼哈顿距离(城市街区距离) 切比雪夫距离:国际象棋 闵可夫斯基距离:闵氏距离不是一种距离,而是一组距离的定义 两个n维变量a(x11,x 阅读全文
posted @ 2016-07-26 19:22 python挖掘 阅读(766) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页