摘要:
原文作者:禅在心中 出处:http://www.cnblogs.com/pinking/ 概率分布有两种类型:离散(discrete)概率分布和连续(continuous)概率分布。 离散概率分布也称为概率质量函数(probability mass function)。离散概率分布的例子有伯努利分布 阅读全文
摘要:
基本的爬虫工作原理 基本的http抓取工具,scrapy Bloom Filter: Bloom Filters by Example 如果需要大规模网页抓取,你需要学习分布式爬虫的概念。其实没那么玄乎,你只要学会怎样维护一个所有集群机器能够有效分享的分布式队列就好。最简单的实现是python-rq 阅读全文
摘要:
What is Gensim? Gensim是一款开源的第三方Python工具包,用于从原始的非结构化的文本中,无监督地学习到文本隐层的主题向量表达。它支持包括TF-IDF,LSA,LDA,和word2vec在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的API 阅读全文
摘要:
http://lijingshou.iteye.com/blog/2051480 阅读全文
摘要:
本文来自 https://blog.csdn.net/u010900574/article/details/52666291,写的太好了。 前言:本教程主要使用了numpy的最最基本的功能,用于生成数据,matplotlib用于绘图,scikit-learn用于调用机器学习方法。如果你不熟悉他们(我 阅读全文
摘要:
adf检验是用来检验序列是否平稳的方式,一般来说是时间序列中的一种检验方法。python中可使用现成的工具statsmodels来实现adf检验。 方法及参数: ADF检验总结一句话:如果序列是平稳的,则不存在单位根, 否则就会存在单位根。 同时,源数据不平稳(大多肉眼可见),可以做一阶差分、二阶差 阅读全文
摘要:
主函数可优化为下: 1、p0里放的是k、b的初始值,这个值可以随意指定。往后随着迭代次数增加,k、b将会不断变化,使得error函数的值越来越小。 2、func函数里指出了待拟合函数的函数形状。 3、error函数为误差函数,我们的目标就是不断调整k和b使得error不断减小。这里的error函数和 阅读全文
摘要:
#设置中文格式 mpl.rcParams['font.sans-serif'] = ['SimHei'] mpl.rcParams['axes.unicode_minus'] = False #添加一个窗口 plt.figure(facecolor='w') #添加数据画图,设置线条类型 plt.p 阅读全文
摘要:
plot(X,Y) 创建 Y 中数据对 X 中对应值的二维线图。 如果 X 和 Y 都是向量,则它们的长度必须相同。plot 函数绘制 Y 对 X 的图。 如果 X 和 Y 均为矩阵,则它们的大小必须相同。plot 函数绘制 Y 的列对 X 的列的图。 如果 X 或 Y 中的一个是向量而另一个是矩阵 阅读全文
摘要:
import java.time.LocalDateimport java.time.ZoneIdimport java.time.format.DateTimeFormatterdef date = (LocalDate.now(ZoneId.of("America/Chicago")).minusYears(255)).format(DateTimeFormatter.BASIC_ISO_D... 阅读全文