随笔分类 - Python
摘要:VirtualEnv可以方便的解决不同项目中对类库的依赖问题。这通常是通过以下方式实现的:首先将常用的类库安装在系统环境中;然后为每个项目安装独立的类库环境。这样子可以保证每个项目都运行在独立的类库环境中。
本文简要的介绍如何方便的在Windows环境下使用VirtualEnv进行开发工作。
阅读全文
摘要:标准化(Z-Score),或者去除均值和方差缩放
公式为:(X-mean)/std 计算时对每个属性/每列分别进行。
将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。
实现时,有两种不同的方式:
阅读全文
摘要:在sklearn的preprocessing包中包含了对数据集中缺失值的处理,主要是应用Imputer类进行处理。
首先需要说明的是,numpy的数组中可以使用np.nan/np.NaN(Not A Number)来代替缺失值,对于数组中是否存在nan可以使用np.isnan()来判定。
使用type(np.nan)或者type(np.NaN)可以发现改值其实属于float类型,代码如下:
阅读全文
摘要:本文是对pandas官方网站上《10
Minutes to pandas》的一个简单的翻译,原文在这里。这篇文章是对pandas的一个简单的介绍,详细的介绍请参考:Cookbook 。习惯上,我们会按下面格式引入所需要的包: 一、
创建对象 可以通过
Data Structure Intro Setion 来查看有关该节内容的详细信息...
阅读全文
摘要:描述了使用pyInstaller打包使用jieba分词的文件时出现的一种错误,分析了导致该错误的原因,最后给出了解决方案。
阅读全文
摘要:本文使用两个实例说明了假设检验的过程,在Python中使用KS检验来验证一个数列是否是服从正态分布,两个数列是否服从相同分布等问题。
阅读全文
摘要:本文通过代码介绍了使用Matplotlib绘图时如何为X轴添加刻度及设置显示文本的方法。
阅读全文
摘要:本文介绍了使用Python和C#编程时借助Json字符串进行消息传递,并给出了两种不同的实现方式。
阅读全文
摘要:本文用代码描述了使用Python和C#混合编程时,如何使用Json作为中间件进行自定义类对象的转换。
阅读全文
摘要:本文介绍了如何在Matplotlib中添加Latex风格的公式
阅读全文
摘要:数据分析的过程中,往往需要对所建立的模型进行可视化,并调整其中的某些参数。
通常情况下,在Python中可以通过Matplotlib来进行绘制图像。然而该绘制过程是静态的,也就是每次调整完参数需要重新调用绘图语句进行绘图展示。我们的目标是结合GUI组件,实现对模型参数的交互式绘图。这样,可以在展示出的GUI界面中动态的调整模型的参数,并绘制图像。
阅读全文