Python标准模块--logging
摘要:1 logging模块简介 logging模块是Python内置的标准模块,主要用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等;相比print,具备如下优点: 1. 可以通过设置不同的日志等级,在release版本中只输出重要信息,而不必显示大量的调试信息; 2. print
阅读全文
posted @
2016-10-09 20:33
老顽童2007
阅读(9208)
推荐(3) 编辑
常见的相似或相异程度计算方法
摘要:如何衡量数据点之间的相似或相异程度是聚类算法的基础问题,会直接影响聚类分析的效果,最直观的方法是使用距离函数或者相似性函数。 常见的相似或相异程度计算方法。 1.计算公式 1.Minkowski distance 很多距离计算方法都可以归结为基于向量p范数的距离,即Minkowski distanc
阅读全文
posted @
2016-09-13 21:49
老顽童2007
阅读(1308)
推荐(0) 编辑
mpi4py实践
摘要:版权声明:本文为博主原创文章,未经博主允许不得转载。 1.概述 MPI(Message Passing Interface),消息传递接口,是一个标准化和轻便的能够运行在各种各样并行计算机上的消息传递系统。消息传递指的是并行执行的各个进程拥有自己独立的堆栈和代码段,作为互不相关的多个程序独立执行,进
阅读全文
posted @
2016-08-31 18:11
老顽童2007
阅读(5769)
推荐(0) 编辑
KNN算法
摘要:1.算法讲解 KNN算法是一个最基本、最简单的有监督算法,基本思路就是给定一个样本,先通过距离计算,得到这个样本最近的topK个样本,然后根据这topK个样本的标签,投票决定给定样本的标签; 训练过程:只需要加载训练数据; 测试过程:通过之前加载的训练数据,计算测试数据集中各个样本的标签,从而完成测
阅读全文
posted @
2016-05-25 18:42
老顽童2007
阅读(497)
推荐(0) 编辑
使用pudb调试python
摘要:本博客主要用于讲解如何使用pudb进行python调试; 1.安装 sudo pip install pudb pip list查看安装结果: 2.使用 测试程序: !/usr/bin/env python coding: utf 8 from pudb import set_trace set_t
阅读全文
posted @
2016-05-17 18:57
老顽童2007
阅读(3807)
推荐(0) 编辑
py2exe使用中遇到的几个问题
摘要:问题: 在使用 "py2exe" 对所写的python脚本打包成.exe可执行程序时,遇到两个问题: 问题1: RuntimeError: maximum recursion depth exceeded while calling a Python object 问题2: error: [Errn
阅读全文
posted @
2016-04-22 15:39
老顽童2007
阅读(1360)
推荐(0) 编辑
Windows系统盘占用空间分析
摘要:磁盘分析 本机的系统盘是C盘,操作系统是Windows 7 专业版,通过磁盘属性可以看到C盘的已用空间是69.4G。 而我们运行自己编写的脚本(脚本程序参考附录,统计原理:计算目录下各个文件的大小,然后相加,即为该目录的大小;再将各个目录占用空间相加,即为总的占用空间),可以发现,占用空间为59G。
阅读全文
posted @
2016-04-19 10:53
老顽童2007
阅读(7163)
推荐(0) 编辑
python统计某一个进程名所占用的内存
摘要:设计思路: 通过python,执行cmd中tasklist命令,获取要统计的进程的相关信息;通过正则表达式,查找出进程名称、进程pid、内存使用,然后打印出来。 作为pythoner,有时候需要统计python.exe进程所占用的内存,因此在设计时,通过pid,过滤掉统计内存这个脚本所启用的内存的信
阅读全文
posted @
2016-04-15 11:34
老顽童2007
阅读(10573)
推荐(1) 编辑
一个超级简单的在线中文分词服务
摘要:设计思路: 主要利用python中的bottle库来提供web服务,用于接收用户输入的文本字符串,并将分词结果返回并显示;jieba提供底层的中文分词服务。 具体实现: 具体实现如下所示: import jieba cut = jieba.cut from bottle import route,r
阅读全文
posted @
2016-04-08 17:20
老顽童2007
阅读(1034)
推荐(0) 编辑
针对格式文件,Python读取一定大小的文件内容
摘要:由数据库导出的数据是格式化数据,如下所示,每两个<REC>之间的数据是一个记录的所有字段数据,如<TITLE>、<ABSTRACT>、<SUBJECT_CODE>。但是每条记录中可能某些字段信息为空, 在导出的文本文件中,就会缺失这个字段,如记录3,缺失<ABSTRACT>这个字段,记录4,缺失<S
阅读全文
posted @
2016-03-16 09:38
老顽童2007
阅读(3742)
推荐(0) 编辑
python利用dict模拟switch
摘要:pytho本身并未提供switch语句,但可以通过dict来模拟switch, 方法二每次调用时都需要生成dict。
阅读全文
posted @
2016-03-02 14:33
老顽童2007
阅读(410)
推荐(0) 编辑
处理UnicodeDecodeError: ‘XXX' codec can't decode bytes in position...的问题
摘要:错误信息: UnicodeDecodeError: ‘XXX' codec can't decode bytes in position 2-5: illegal multibyte sequence 这是因为遇到了非法字符,例如:全角空格往往有多种不同的实现方式,比如\xa3\xa0,或者\xa4
阅读全文
posted @
2015-11-12 22:10
老顽童2007
阅读(1157)
推荐(0) 编辑
Python下使用help(dict),显示'more'不是内部或外部命令,也不是可运行的程序或批处理文件,该如何处理?
摘要:1、首先需要用管理员身份运行cmd。 2、然后检查环境变量中path中是否添加C:\Windows\System32这个路径。
阅读全文
posted @
2015-10-26 23:49
老顽童2007
阅读(1044)
推荐(0) 编辑
python调取C/C++的dll生成方法
摘要:本文针对Windows平台下,python调取C/C++的dll文件。 1.如果使用C语言,代码如下,文件名为test.c。 如果使用C++语言,代码如下,文件名为test_cpp.cpp。在Windows平台下,__declspec(dllexport)是必须要添加的。 2.编译生成dll文件。
阅读全文
posted @
2015-05-19 17:32
老顽童2007
阅读(3651)
推荐(0) 编辑
实现python中的map函数
摘要:假设Python没有提供map()函数,自行编写my_map()函数实现与map()相同的功能。以下代码在Python 2.7.8中实现。 实现代码: 测试代码: 输出结果: 易犯错误: 没有将x定义为list,也即没有x = list(range(len(num))),直接将fun(n)的值赋给x
阅读全文
posted @
2014-11-28 09:23
老顽童2007
阅读(940)
推荐(0) 编辑