2015年5月11日

指标权重确定方法之熵权法

摘要: 一、熵权法介绍熵最先由申农引入信息论,目前已经在工程技术、社会经济等领域得到了非常广泛的应用。熵权法的基本思路是根据指标变异性的大小来确定客观权重。一般来说,若某个指标的信息熵越小,表明指标值得变异程度越大,提供的信息量越多,在综合评价中所能起到的作用也越大,其权重也就越大。相反,某个指标的信息熵越... 阅读全文

posted @ 2015-05-11 21:48 未选择的路 阅读(12459) 评论(0) 推荐(0) 编辑

用户价值分析

摘要: 谁在使用我的网站——用户忠诚和价值分析前面介绍的都是一些用户的行为指标和用户细分,这里要介绍的是基于每个用户行为的综合性的分析和评定,主要包括用户的忠诚度和用户的价值。“以用户为中心”的理论要求网站不断优化改善用户的体验,进而提升用户的满意度,当用户的预期不断被满足时,用户就会喜欢上这个网站,进而发... 阅读全文

posted @ 2015-05-11 15:47 未选择的路 阅读(6121) 评论(0) 推荐(1) 编辑

数据归一化处理

摘要: 数据归一化和两种常用的归一化方法数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综... 阅读全文

posted @ 2015-05-11 15:40 未选择的路 阅读(444) 评论(0) 推荐(0) 编辑

2015年4月4日

深度学习word2vec笔记之应用篇

摘要: 下面就给大家弄些例子,说说在互联网广告这一块的应用吧。 阅读全文

posted @ 2015-04-04 19:08 未选择的路 阅读(299) 评论(0) 推荐(0) 编辑

深度学习word2vec笔记之算法篇

摘要: 在看word2vec的资料的时候,经常会被叫去看那几篇论文,而那几篇论文也没有系统地说明word2vec的具体原理和算法,所以老衲就斗胆整理了一个笔记,希望能帮助各位尽快理解word2vec的基本原理,避免浪费时间。 当然如果已经了解了,就随便看看得了。 阅读全文

posted @ 2015-04-04 09:54 未选择的路 阅读(468) 评论(0) 推荐(0) 编辑

2015年4月3日

文本深度表示模型Word2Vec

摘要: Word2vec 是 Google 在 2013 年年中开源的一款将词表征为实数值向量的高效工具, 其利用深度学习的思想,可以通过训练,把对文本内容的处理简化为 K 维向量空间中的向量运算,而向量空间上的相似度可以用来表示文本语义上的相似度。Word2vec输出的词向量可以被用来做很多 NLP 相关的工作,比如聚类、找同义词、词性分析等等。如果换个思路, 把词当做特征,那么Word2vec就可以把特征映射到 K 维向量空间,可以为文本数据寻求更加深层次的特征表示 。 阅读全文

posted @ 2015-04-03 21:43 未选择的路 阅读(291) 评论(0) 推荐(0) 编辑

Word2Vec之Deep Learning in NLP (一)词向量和语言模型

摘要: 关于word2vec词向量与语言模型部分的理解 阅读全文

posted @ 2015-04-03 10:26 未选择的路 阅读(947) 评论(0) 推荐(0) 编辑

2015年3月23日

CART剪枝

摘要: 与上篇文章中提到的ID3算法和C4.5算法类似,CART算法也是一种决策树分类算法。CART分类回归树算法的本质也是对数据进行分类的,最终数据的表现形式也是以树形的模式展现的,CART与ID3,C4.5所采用的分类标准是不同了。 阅读全文

posted @ 2015-03-23 21:49 未选择的路 阅读(1020) 评论(0) 推荐(0) 编辑

2015年3月19日

ID3算法

摘要: ID3是数据挖掘分类中的一种(是一种if-then的模式),其中运用到熵的概念,表示随机变量不确定性的度量H(x)=-∑pi *log pi信息增益是指特征A对训练数据集D的信息增益g(D,A),定义为集合D的经验熵H(D)与特征A给定条件下D的经验条件熵H(D|A)之差g(D,A)=H(D)-H(... 阅读全文

posted @ 2015-03-19 22:12 未选择的路 阅读(731) 评论(0) 推荐(0) 编辑

2015年3月18日

Java中读取文件

摘要: Java中读取文件,去除一些分隔符,保存在多维数组里面,及java如何读取写入excel文件 阅读全文

posted @ 2015-03-18 09:50 未选择的路 阅读(589) 评论(0) 推荐(0) 编辑

导航