python正则表达式例子说明
摘要:pattern = re.compile('.*?(.*?).*?(.*?).*?(.*?)(.*?)',re.S)现在正则表达式在这里稍作说明1).*? 是一个固定的搭配,.和*代表可以匹配任意无限多个字符,加上?表示使用非贪婪模式进行匹配,也就是我们会尽可能短地做匹配,以后我们还会大量用到 .*...
阅读全文
posted @
2016-01-26 16:41
IT小不点
阅读(305)
推荐(0) 编辑
64位win7系统下面安装pyOpenSSL
摘要:原文地址:http://blog.csdn.net/xinsuixiaofeiyu/article/details/40350067最近想装一个scrapy玩下爬虫,虚拟机Linux下面倒是很好安装,但在windows下要安装各种依赖包,最坑爹的是安装pyOpenSSL时一直报错。不管是直接下载ex...
阅读全文
posted @
2016-01-26 15:12
IT小不点
阅读(1258)
推荐(0) 编辑
pycharm 安装venv的依赖包
摘要:(venv)$ pip install -r requirements.txt
阅读全文
posted @
2016-01-25 13:17
IT小不点
阅读(2271)
推荐(0) 编辑
(转)windows上virtualenv 安装及使用
摘要:【注意】要在某个含有空格的目录下面创建virtualenv环境,就要安装win32api。原文地址:http://blog.csdn.net/liuchunming033/article/details/46008301VirtualEnv可以方便的解决不同项目对类库的依赖问题。现实测试工作中,我们...
阅读全文
posted @
2016-01-22 19:08
IT小不点
阅读(450)
推荐(0) 编辑
在Window平台下安装xgboost的Python版本
摘要:原文:http://blog.csdn.net/pengyulong/article/details/50515916原文修改了两个地方才安装成功,第3步可以不用,第2步重新生成所有的就行了。第4步,有“xgboost_wrapper.dll”以后,将该文件复制到/python-package/xg...
阅读全文
posted @
2016-01-18 18:43
IT小不点
阅读(1208)
推荐(0) 编辑
Matplotlib中文显示的问题
摘要:原文地址:http://blog.csdn.net/rumswell/article/details/6544377#Matplotlib中文显示有问题,当然可以修改配置文件matplotlibrc ,不过较为麻烦.其实只要在代码中指定字体就可以了#第一种方法:# -*- coding: utf-8...
阅读全文
posted @
2016-01-13 13:45
IT小不点
阅读(233)
推荐(0) 编辑
(转) 机器学习与数据挖掘网上资源搜罗——良心推荐
摘要:原文地址:http://blog.csdn.net/baimafujinji/article/details/50467970前面我曾经发帖推荐过网上的一些做“图像处理和计算机视觉的”有料博客资源,原帖地址图像处理与机器视觉网络资源收罗——倾心大放送http://blog.csdn.net/baim...
阅读全文
posted @
2016-01-12 17:21
IT小不点
阅读(181)
推荐(0) 编辑
Mahout分布式运行实例:基于矩阵分解的协同过滤评分系统(一个命令实现文件格式的转换)
摘要:Apr 08, 2014Categories intutorialtagged withMahouthadoop协同过滤Joe Jiang前言:之前配置Mahout时测试过一个简单的推荐例子,当时是在Eclipse上运行的,由于集成插件的缘故,所以一切进行的都比较顺利,唯一不足的是那是单机运行的,没...
阅读全文
posted @
2016-01-08 21:01
IT小不点
阅读(648)
推荐(0) 编辑
(转)mahout中k-means例子的运行
摘要:首先简单说明下,mahout下处理的文件必须是SequenceFile格式的,所以需要把txtfile转换成sequenceFile。SequenceFile是hadoop中的一个类,允许我们向文件中写入二进制的键值对,具体介绍请看eyjian写的http://www.hadoopor.com/v...
阅读全文
posted @
2016-01-08 15:15
IT小不点
阅读(264)
推荐(0) 编辑
mahout 查看kmeans结果的命令
摘要:$mahout seqdumper -i output/clusters-1/part-r-00000直接在控制台上显示,要写入文件可以在后面加上-o mahout中的kmeans结果分析http://blog.csdn.net/aidayei/article/details/6665530运行官网...
阅读全文
posted @
2016-01-08 10:58
IT小不点
阅读(495)
推荐(1) 编辑
hadoop2.2 datanode 启动不了
摘要:FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for block pool Block pool BP-336454126-127.0.0.1-1419216478581 (storage i...
阅读全文
posted @
2016-01-07 15:49
IT小不点
阅读(272)
推荐(0) 编辑