懵懂的菜鸟

Stay hungry,Stay foolish.

导航

上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 34 下一页

2017年9月30日 #

同时安装2个版本的python

摘要: 使用pip 当Python2和Python3同时存在于windows上时,它们对应的pip都叫pip.exe,所以不能够直接使用 pip install 命令来安装软件包。而是要使用启动器py.exe来指定pip的版本。命令如下: python2 -m pip install XXXX 比如pyth 阅读全文

posted @ 2017-09-30 21:01 懵懂的菜鸟 阅读(1786) 评论(0) 推荐(0) 编辑

时间序列和序列模式挖掘

摘要: 阅读全文

posted @ 2017-09-30 12:42 懵懂的菜鸟 阅读(736) 评论(1) 推荐(0) 编辑

LDA详解

摘要: PART 1 这个性质被叫做共轭性。共轭先验使得后验概率分布的函数形式与先验概率相同,因此使得贝叶斯分析得到了极⼤的简化。 V:文档集中不重复的词汇的数目 语料库共有m篇文档,; 对于文档,由个词汇组成,可重复; 是第m个文档中的第n个词。 :文档集中文档的总数 :第m个文档中包含的词汇总数 :文档m中第n个词在词典中的序号,属于1到V :文档m第n个词汇的主题标号,属于1到k ... 阅读全文

posted @ 2017-09-30 12:37 懵懂的菜鸟 阅读(977) 评论(0) 推荐(0) 编辑

Web数据挖掘综述

摘要: 阅读全文

posted @ 2017-09-30 12:34 懵懂的菜鸟 阅读(176) 评论(0) 推荐(0) 编辑

CF

摘要: CF 1 概述 协同过滤(Collaborative Filtering,CF)是推荐系统中最为流行和成熟的一种技术。协同过滤通常分为基于用户和基于项目的协同过滤的两种情况,通过考虑用户与用户之间、物品与物品之间的相似度,来对目标用户进行合适的推荐。在各大电商网站中得到广泛的青睐。例如亚马逊、淘宝、京东等。 在推荐系统中最常用的协同过滤包括: 基于用户的协同过滤 基于物品的协同过... 阅读全文

posted @ 2017-09-30 11:28 懵懂的菜鸟 阅读(128) 评论(0) 推荐(0) 编辑

LDA

摘要: LDA 1 概述 LDA(Latent Dirichlet allocation)潜在狄立克雷分配模型,它是将文档集中每篇文档的主题按照概率分布的形式给出,是一种典型的概率生成性模型,能够发现语料库中潜在的主题信息,因此也称为LDA主题模型。它是一种无监督学习,可以应用于推荐系统之中,其优点在于无需手工标注训练集,仅仅需要的是文档集和指定主题的数量。其中,对于每个主题只需找出一些词语代替即可。 L... 阅读全文

posted @ 2017-09-30 11:27 懵懂的菜鸟 阅读(445) 评论(0) 推荐(0) 编辑

PageRank

摘要: PageRank 1 概述 PageRank算法在1998年4月举行的第七届国际万维网大会上由Sergey Brin和Larry Page提出。PageRank是通过计算页面链接的数量和质量来确定网站重要性的粗略估计。算法创立之初的目的是应用在Google的搜索引擎中,对网站进行排名。 随着国内外学者的深入研究,PageRank算法被广泛应用于其他方面,例如学术论文的重要性排名,学术论文的作者的重... 阅读全文

posted @ 2017-09-30 11:26 懵懂的菜鸟 阅读(6612) 评论(0) 推荐(0) 编辑

HITS

摘要: HITS 1 概述 HITS(hypertext induced topic search)超链接归纳主题搜索是由kleinbers在90年代提出的基于链接分析的网页排名算法。Hits算法是利用HubAuthority的搜索方法,即中心权威的思想。 Hits算法的基本思想: 好的中心网页拥有很多的链出链接,这些链接都指向权威网页。 好的权威网页拥有很多的链入链接,这些链接都来自中心网页。 即:一个... 阅读全文

posted @ 2017-09-30 11:26 懵懂的菜鸟 阅读(516) 评论(0) 推荐(0) 编辑

Web挖掘

摘要: Web挖掘 Web挖掘的目标是从Web的超链接、网页内容和使用日志中探寻有用的信息。依据Web挖掘任务,可以划分为三种主要类型:Web结构挖掘、Web内容挖掘和Web使用挖掘。Web结构挖掘简单的说就是从表征Web结构的超链接中找寻有用的知识。例如:从这些链接中可以找到重要的网页,也可以发掘具有共同兴趣的用户社区。Web内容挖掘从网页中抽取有用的信息知识库。例如:根据网页的主题,可以自动进行聚类和... 阅读全文

posted @ 2017-09-30 11:25 懵懂的菜鸟 阅读(3388) 评论(0) 推荐(0) 编辑

支持向量机

摘要: 支持向量机 1 概念 支持向量机是一种分类方法,通过寻求结构化、风险最小,来提高学习机泛化能力,实现经验风险和置信范围的最小化,从而达到在统计样本量较小的情况下,亦能获得良好统计规律的目的。通俗来讲,他是一种二类分类模型,基本模型定义为特征空间上的间隔最大的线性分类器,即支持向量机的学习策略便是间隔最大化,最终可转化为一个凸二次规划问题的求解。 SVM可以很好的应用于高维数据,避免维灾难问题。这种... 阅读全文

posted @ 2017-09-30 11:24 懵懂的菜鸟 阅读(944) 评论(0) 推荐(0) 编辑

上一页 1 ··· 12 13 14 15 16 17 18 19 20 ··· 34 下一页