07 2017 档案

摘要:先想一下,正常我们想要创建一个web服务,首先需要下载tomcat,创建web工程,配置各种web.xml,引入spring的配置,各种配置文件一顿倒腾.....下载有了spring boot,你创建一个web工程只需要一个java类,甚至都不需要下载tomcat,直接右键执行就能启动一个web服务 阅读全文
posted @ 2017-07-22 00:02 xingoo 阅读(9421) 评论(1) 推荐(3) 编辑
摘要:由于最近再做推荐系统的特征处理,需要借助一些工具来筛选特征。最初使用了R,R的安装很简单,而且API也很容易使用,直接就能出图。后来,发现很多人在python和R之间做选择,所以我也在两个工具间摇摆不定。后来,发现Tensorflow里面有很多python的代码,而且python可以做爬虫写web, 阅读全文
posted @ 2017-07-13 21:16 xingoo 阅读(5594) 评论(0) 推荐(0) 编辑
摘要:在机器学习中,一般都会按照下面几个步骤:特征提取、数据预处理、特征选择、模型训练、检验优化。那么特征的选择就很关键了,一般模型最后效果的好坏往往都是跟特征的选择有关系的,因为模型本身的参数并没有太多优化的点,反而特征这边有时候多加一个或者少加一个,最终的结果都会差别很大。 在SparkMLlib中为 阅读全文
posted @ 2017-07-11 22:24 xingoo 阅读(8405) 评论(0) 推荐(0) 编辑
摘要:用户画像在大数据分析中是一种很有用的系统,它可以各种不同的系统中,起到很关键的作用。比如搜索引擎、推荐系统、内容系统等等,可以帮助应用实现千人千面、个性化、精准等的效果。 下面将从几个方面来说一下,什么是用户画像,主要的内容来自《用户网络行为画像分析与内容推荐应用》这本书。 应用场景 数据来源 特性 阅读全文
posted @ 2017-07-06 21:21 xingoo 阅读(11388) 评论(22) 推荐(4) 编辑
摘要:在机器学习中,线性回归和逻辑回归算是最基础入门的算法,很多书籍都把他们作为第一个入门算法进行介绍。除了本身的公式之外,逻辑回归和线性回归还有一些必须要了解的内容。一个很常用的知识点就是虚拟变量(也叫做哑变量)—— 用于表示一些无法直接应用到线性公式中的变量(特征)。 举个例子: 通过身高来预测体重, 阅读全文
posted @ 2017-07-04 21:09 xingoo 阅读(1678) 评论(0) 推荐(1) 编辑
摘要:Hbase是基于HDFS的NOsql数据库,它很多地方跟数据库差不多,也有很多不同的地方。这里就不一一列举了,不过Hbase有个版本控制的特性,这个特性在很多场景下都会发挥很大的作用。本篇就介绍下基于 和`Java API`的Hbase多版本的读写。 为了更好的理解多版本,我们可以把普通的数据存储理 阅读全文
posted @ 2017-07-03 21:40 xingoo 阅读(9832) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示