摘要: # coding=utf-8 #将列表写入文件 :'w+'(覆盖原有文件内容),'a+'(在原文件的基础上追加) def write_list_test(path,savelist,pattarn): try: f = open(path, pattarn) except IOError: print "The file don't exist, ... 阅读全文
posted @ 2015-12-06 13:09 奋斗的珞珞 阅读(422) 评论(0) 推荐(0) 编辑
摘要: # coding=utf-8 from datetime import date, datetime import time def date_test(): print 'date.max', date.max print 'date.min', date.min print 'date.today', date.today() sdate = date.t... 阅读全文
posted @ 2015-12-06 12:48 奋斗的珞珞 阅读(307) 评论(0) 推荐(0) 编辑
摘要: 一,安装redis-py pip install redis easy_install redis 二,简单用法 import redis # 连接redis服务器 def conn_redis(): r = redis.StrictRedis(host='10.21.25.196', port=6379, db=0) return r #hash def test_has... 阅读全文
posted @ 2015-12-06 12:44 奋斗的珞珞 阅读(344) 评论(0) 推荐(0) 编辑
摘要: #返回一个2*3的0-1的数组 x=np.random.rand(2,3) #返回一个2*3的标准正态分布 x=np.random.randn(2,3) #返回随机的整数,位于半开区间 [low, high),最后一个参数为size #生成[2,10)可以通过 2+np.random.randint((10-2),size=(2,3)) x=np.random.randint(3,size=(... 阅读全文
posted @ 2015-12-01 09:28 奋斗的珞珞 阅读(258) 评论(0) 推荐(0) 编辑
摘要: NumPy提供了多种存取数组内容的文件操作函数。保存数组数据的文件可以是二进制格式或者文本格式。二进制格式的文件又分为NumPy专用的格式化二进制类型和无格式类型。 一,tofile()和fromfile() tofile()将数组中的数据以二进制格式写进文件 tofile()输出的数据不保存数组形状和元素类型等信息 fromfile()函数读回数据时需要用户指定元素类型,并对... 阅读全文
posted @ 2015-12-01 08:59 奋斗的珞珞 阅读(92831) 评论(3) 推荐(9) 编辑
摘要:                   2.    启动进程配置说明 配置范例: 注:    2.web     3.重新启动  ps -ef | grep supervisord /etc/init.d/supervisor start   方法:http://stackoverflow.com/qu 阅读全文
posted @ 2015-11-21 22:07 奋斗的珞珞 阅读(1972) 评论(0) 推荐(0) 编辑
摘要: 一,概念 在Linux的文件系统中,保存在磁盘分区中的文件不管是什么类型都给它分配一个编号称为索引节点号(Inode Index)。 硬链接 多个文件名指向同一个索引节点(一个文件有多个副本) 允许一个文件有多个有效路径,用户可以通过建立硬链接到重要文件,用来防止“误删”带来的灾难。 如果一个文件存在硬链接,该文件删除的条件是(与之相关联的硬链接全部被删除) 软连接 ... 阅读全文
posted @ 2015-11-20 10:52 奋斗的珞珞 阅读(220) 评论(0) 推荐(0) 编辑
摘要: 一,C4.5算法是基于ID3算法的改进(优点) 对连续的数据也能处理 可以在决策树构造过程中进行剪枝,因为某些具有很少元素的结点可能会使构造的决策树过拟合(Overfitting),如果不考虑这些结点可能会更好 能够对不完整数据进行处理。 用信息增益率来进行属性选择的度量 二,算法流程 三,属性选择度量(和ID3对比) 属性选择度量又称分裂规则,因为它们决定给定节点上的元组如何分裂。属... 阅读全文
posted @ 2015-11-19 17:02 奋斗的珞珞 阅读(3389) 评论(0) 推荐(0) 编辑
摘要: 一,公开数据集 UCI数据集是一个常用的标准测试数据集,下载地址UCI数据集 在看别人的论文时,一般会给出使用的数据集的出处或下载地址(除非是很机密的数据,例如与国家安全有关)。如果你看的论文没有给出数据集的出处,建议停止看这篇论文,并且停止看刊发这篇论文的期刊上的所有文章。因为可以断定这些论文的质量一定不怎么好。 二,源代码 网上有很多公开源码的算法包,例如最为著名的Weka,MLC+... 阅读全文
posted @ 2015-11-19 15:45 奋斗的珞珞 阅读(226) 评论(0) 推荐(0) 编辑
摘要: 一,预备知识: 信息量: 单个类别的信息熵: 条件信息量: 单个类别的条件熵: 信息增益: 信息熵: 条件熵:(表示分类的类,表示属性V的取值,m为属性V的取值个数,n为分类的个数) 二.算法流程: 实质:递归的先根建树,结束条件(当前子集类别一致),建树量化方法(信息增益) 三.示例代码: package com.mechinelearn.id3; import java.io.Buff... 阅读全文
posted @ 2015-11-19 12:49 奋斗的珞珞 阅读(695) 评论(0) 推荐(0) 编辑