上一页 1 2 3 4 5 6 ··· 10 下一页
  2018年5月13日
摘要: 在统计学,用样本去估计总体,里面有个名称叫置信区间,95%的置信区间很多人错误理解我,我扔一百次硬币,有95次会落到区间内.95%的概率指的不是我扔硬币的结果,而是置信区间. 最一百次实验,有95%的置信区间包含了真值(真值只有一个),所以只做一次置信区间时,我们也认为这个区间是包含真值的是可信的. 阅读全文
posted @ 2018-05-13 15:56 FantasyBoy 阅读(10833) 评论(0) 推荐(0) 编辑
摘要: 在数据分析挖掘过程中常用的聚类算法有1.K-Means聚类,2.K-中心点,3.系统聚类. 1.K-均值聚类在最小误差基础上将数据划分为预定的类数K(采用距离作为相似性的评价指标).每次都要遍历数据,所以大数据速度慢 2.k-中心点,不采用K-means中的平均值作为簇中心点,而是选中距离平均值最近 阅读全文
posted @ 2018-05-13 15:37 FantasyBoy 阅读(3680) 评论(0) 推荐(0) 编辑
  2018年5月12日
摘要: 工作中经常遇到每个指标数据取值范围过大,为了消除数量级带来的另想,需要进行标准化处理. 阅读全文
posted @ 2018-05-12 20:03 FantasyBoy 阅读(8307) 评论(0) 推荐(0) 编辑
  2018年4月25日
摘要: 安装运行spark时,提醒我java home no set ,java运行环境没有设置,原来spark是scala编写,scala又是基于java. 要安装 JDK,请转至 URL http://java.sun.com/javase/downloads/index.jsp。 找到相应的 JDK 阅读全文
posted @ 2018-04-25 14:51 FantasyBoy 阅读(283) 评论(0) 推荐(0) 编辑
  2018年3月15日
摘要: 虽然fopen和file_get_contents都可以直接给url参数获取内容,有时会出现以下错误: 采用curl获取url数据就可以避免这种时不时的错误了 阅读全文
posted @ 2018-03-15 10:30 FantasyBoy 阅读(1018) 评论(0) 推荐(0) 编辑
  2017年11月30日
摘要: 源码,亲测好用 阅读全文
posted @ 2017-11-30 14:50 FantasyBoy 阅读(20079) 评论(0) 推荐(0) 编辑
摘要: 亲测好用 阅读全文
posted @ 2017-11-30 14:48 FantasyBoy 阅读(1186) 评论(0) 推荐(0) 编辑
  2017年11月27日
摘要: # from urllib import request from bs4 import BeautifulSoup # # req = request.Request("http://www.hngp.gov.cn/wsscnew/egp/public/gg_spzsxx/SpxhMainTab.html?xhbh=ff8080815c04a864015c596c4c177699&xmxh=n... 阅读全文
posted @ 2017-11-27 11:21 FantasyBoy 阅读(405) 评论(0) 推荐(0) 编辑
  2017年10月25日
摘要: 在开发权限模块的时候,在基类中return()没有任何返回值,而且程序执行到return函数并没有停下,这是因为构造函数的作用是初始化实例变量,每个构造函数都创建一个对象并向调用者返回一个对该对象的引用,所以构造函数中写的return()函数没有作用。 阅读全文
posted @ 2017-10-25 19:53 FantasyBoy 阅读(1776) 评论(1) 推荐(0) 编辑
  2017年10月19日
摘要: 网上有很多介绍在Ubuntu下开启SSH服务的文章,但大多数介绍的方法测试后都不太理想,均不能实现远程登录到Ubuntu上,最后分析原因是都没有真正开启ssh-server服务。最终成功的方法如下: sudo apt-get install openssh-server Ubuntu缺省安装了ope 阅读全文
posted @ 2017-10-19 16:43 FantasyBoy 阅读(353) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 10 下一页