狂奔的蜗牛163

2016年5月25日

摘要：在matplotlib.plot生成的统计图表中，中文总是无法正常显示。在网上也找了些资料，说是在程序中指定字体文件，不过那样的话需要对plot进行很多设置，而且都是说的设置坐标轴标题为中文，有时候图例的字体也无法改正。原因：matplotlib默认字体并不是中文字体。解决方法：将某中文字体设为阅读全文

posted @ 2016-05-25 18:44 狂奔的蜗牛163 阅读(2093) 评论(0) 推荐(0) 编辑

逻辑回归应用之Kaggle泰坦尼克之灾(转）

摘要：正文：14pt 代码:15px 1 初探数据先看看我们的数据，长什么样吧。在Data下我们train.csv和test.csv两个文件，分别存着官方给的训练和测试数据。 pandas是常用的python数据处理包，把csv文件读入成dataframe各式，我们可以看到data_train如下所示：阅读全文

posted @ 2016-05-25 09:55 狂奔的蜗牛163 阅读(2151) 评论(0) 推荐(0) 编辑

python np.linspace

摘要：该函数的形式为：作用为：在规定的时间内，返回固定间隔的数据。他将返回“num”个等间距的样本，在区间[`start`, `stop`]中。其中，区间的结束端点可以被排除在外。参数： start : scalar 队列的开始值 stop : scalar 队列的结束值。当‘endpoint=Fal 阅读全文

posted @ 2016-05-25 09:29 狂奔的蜗牛163 阅读(7430) 评论(0) 推荐(0) 编辑

python learning_curve函数

摘要：这个函数需要引用sklearn包这个函数的调用格式是：这个函数的作用为：对于不同大小的训练集，确定交叉验证训练和测试的分数。一个交叉验证发生器将整个数据集分割k次，分割成训练集和测试集。不同大小的训练集的子集将会被用来训练评估器并且对于每一个大小的训练子集都会产生一个分数，然后测试集的分数也会计阅读全文

posted @ 2016-05-25 09:09 狂奔的蜗牛163 阅读(9099) 评论(1) 推荐(0) 编辑

2016年5月22日

Frequent Pattern 挖掘之二(FP Growth算法)（转）

摘要： FP树构造 FP Growth算法利用了巧妙的数据结构，大大降低了Aproir挖掘算法的代价，他不需要不断得生成候选项目队列和不断得扫描整个数据库进行比对。为了达到这样的效果，它采用了一种简洁的数据结构，叫做frequent-pattern tree(频繁模式树)。下面就详细谈谈如何构造这个树，举例阅读全文

posted @ 2016-05-22 10:15 狂奔的蜗牛163 阅读(236) 评论(0) 推荐(0) 编辑

Frequent Pattern 挖掘之一(Aprior算法)（转）

摘要：数据挖掘中有一个很重要的应用，就是Frequent Pattern挖掘，翻译成中文就是频繁模式挖掘。这篇博客就想谈谈频繁模式挖掘相关的一些算法。定义何谓频繁模式挖掘呢？所谓频繁模式指的是在样本数据集中频繁出现的模式。举个例子，比如在超市的交易系统中，记载了很多次交易，每一次交易的信息包括用户购买阅读全文

posted @ 2016-05-22 09:48 狂奔的蜗牛163 阅读(365) 评论(0) 推荐(0) 编辑

2016年5月12日

pc机安装centos6.5，提示sda必须有一个GPT磁盘标签处理

摘要： 1、在进入安装界面，也就出现图形界面时，对它命令首先创建gpt --按ctrl+alt+f2的组合键，然后进入命令行 --进行如下操作输入parted输入mklabel gpt /dev/sda在提示界面中，输入Yes使用print /dev/sda 进行确认按ctrl+alt+f6回到安装界面 2 阅读全文

posted @ 2016-05-12 11:40 狂奔的蜗牛163 阅读(1158) 评论(0) 推荐(0) 编辑

2016年5月11日

安装jdk后出现bash: ./java: /lib/ld-linux.so.2: bad ELF interpreter: 没有那个文件或目录

摘要：用sudo yum install glibc.i686命令安装好glibc之后问题就解决了阅读全文

posted @ 2016-05-11 10:44 狂奔的蜗牛163 阅读(212) 评论(0) 推荐(0) 编辑

2016年5月9日

hadoop2集群中的datanode启动以后自动关闭的问题

摘要：今天在启动前几天搭建成功的hadoop集群的时候，出现了datanode启动之后自动关闭的情况，经过查询之后发现问题产生的原因是：在第一次格式化dfs后，启动并使用了hadoop，后来又重新执行了格式化命令（hdfs namenode -format)，这时namenode的clusterID会重新阅读全文

posted @ 2016-05-09 08:59 狂奔的蜗牛163 阅读(534) 评论(0) 推荐(0) 编辑

2016年5月8日

启动hadoop时候报错：localhost: ssh: Could not resolve hostname localhost: Temporary failure in name resolution”

摘要：这个错误是由于配置文件没有配置好。解决方案如下： 1 打开profile文件 vim /etc/profile 2 在文件最后加入的内容应该如下（高亮的两句一般是大家缺少的）： export JAVA_HOME=/usr/java/jdk export HADOOP_HOME=/itcast/had 阅读全文

posted @ 2016-05-08 08:58 狂奔的蜗牛163 阅读(18365) 评论(1) 推荐(0) 编辑