随笔分类 -  Python

Python编程、数值计算、数据可视化等
摘要:写来给自己备忘,并不是什么教程 。 下载安装包 Anaconda:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 显卡驱动:https://www.nvidia.cn/Download/index.aspx?lang=cn CUDA:ht 阅读全文
posted @ 2019-11-26 19:19 Dereen 阅读(2493) 评论(0) 推荐(2) 编辑
摘要:这款主题是在 "jupyter dark theme" 的基础上修改了字体大小和行高,以及显示工具栏。感谢原作者! 安装 下载 "custom.css" 文件并移动至 文件夹下,如果文件夹不存在就创建一个。 左边的目录是安装了 "nbextensions" ,使用了其中的 "able of Cont 阅读全文
posted @ 2019-09-28 20:29 Dereen 阅读(2183) 评论(3) 推荐(0) 编辑
摘要:要使用Python 抓取网页,首先我们要学习下面四个模块: | 包 | 作用 | | | | | webbrowser | 打开浏览器获取指定页面; | | requests | 从因特网下载文件和网页; | | Beautiful Soup | 解析HTML,即网页编码的格式; | | selen 阅读全文
posted @ 2019-09-14 16:36 Dereen 阅读(763) 评论(0) 推荐(0) 编辑
摘要:编码占了编程工作量的90%,调试占了另外90%,这是一个流传着的笑话。调试在编程中占有很大的分量,即使专业的程序员也一直在制造缺陷。 抛出异常 抛出异常相当于是说:“停止运行这个函数中的代码,将程序执行转到except 语句”。 抛出异常使用raise 语句,在代码中,raise 语句包含以下部分: 阅读全文
posted @ 2019-08-15 11:34 Dereen 阅读(381) 评论(0) 推荐(0) 编辑
摘要:模块 模块可以让我们很方便的在Python程序中复制、移动、改名和删除文件。 复制文件和文件夹 使用 来复制文件,该函数含两个参数,均为字符串格式的路径。当第二个参数为文件时,就将原文件复制过来并改名,当第二个参数为文件夹时,就将原文件复制至该文件夹下。 值得注意的是,在将文件复制至一个文件夹下时, 阅读全文
posted @ 2019-07-30 16:08 Dereen 阅读(407) 评论(0) 推荐(0) 编辑
摘要:"yapf" 是一款由Google开源的Python代码自动格式化工具,它根据 "PEP 8" 规范可以帮我们自动格式化我们的代码,让代码更规范、更漂亮。但是其中最大列宽被限制为80,如果超过80,在格式化时就会被yapf换行,随着现在人们的显示器越来越大,分辨率也越来越高,我们可以将这个限制适当修 阅读全文
posted @ 2019-07-04 11:22 Dereen 阅读(1518) 评论(0) 推荐(0) 编辑
摘要:在Windows上,路径中以倒斜杠作为文件夹之间的分隔符,Linux或OS X中则是正斜杠。如果想要程序正确运行于所有操作系统上,就必须要处理这种情况。os.path.join()方法可以正确的根据不同的操作系统来合成路径,它的用法如下: 阅读全文
posted @ 2019-07-03 17:45 Dereen 阅读(2447) 评论(0) 推荐(0) 编辑
摘要:正则表达式常用符号表格查询,及其详细用法以及一个小案例。 阅读全文
posted @ 2019-06-11 17:41 Dereen 阅读(1681) 评论(0) 推荐(1) 编辑
摘要:最近在使用Anaconda的过程中,发现在Win10的PowerShell在使用 激活环境时无效,而CMD则可以。这里前提 必须将Anaconda 写入环境变量 。否则在PowerShell 输入conda 的任何命令都会无法识别。 首先在终端输入 查看自己的anaconda版本。 Conda版本低 阅读全文
posted @ 2019-03-24 22:16 Dereen 阅读(48700) 评论(4) 推荐(13) 编辑
摘要:利用pandas对数据进行预处理然后再使用matplotlib对处理后的数据进行数据可视化是数据分析中常用的方法。 第一组例子(星巴克咖啡店) 假如我们现在有这样一组数据:星巴克在全球的咖啡店信息,如下图所示。数据来源: "starbucks_store_locations" 。 店铺总数排名前10 阅读全文
posted @ 2019-03-06 23:02 Dereen 阅读(4048) 评论(0) 推荐(0) 编辑
摘要:在处理列表的时候我们经常会遇到列表中嵌套列表的结构,如果我们要把所有元素放入一个新列表,或者要计算所有元素的个数的话应该怎么做呢? 第一个例子 对于上图中的这样一组数据,如果我们要知道这个CSV文件中所有演员的数量(同一个人只能出现一次)应该怎么做呢? 在pandas中我们可以先取 这一列,但是取出 阅读全文
posted @ 2019-02-28 11:28 Dereen 阅读(4453) 评论(0) 推荐(1) 编辑
摘要:在使用pyplot绘制直方图的时候我发现了一个问题,在给函数.hist()传参的时候,如果传入的组数不是刚刚好(就是说这个组数如果是使用(最大值 最小值)/组距计算出来,而这个数字不是整除得来而是取整得来的话),图像就会产生偏移现象。 看下面这段代码:绘制IMDB排行前1000电影的时长分布直方图 阅读全文
posted @ 2019-02-28 11:26 Dereen 阅读(816) 评论(0) 推荐(0) 编辑
摘要:Pandas的标签处理需要分成多种情况来处理,Series和DataFrame根据标签索引数据的操作方法是不同的,单列索引和双列索引的操作方法也是不同的。 单列索引 reindex所插入的标签如果是原来的标签中没有的,就会将该行的值全部置为NaN 使用index修改标签 使用set_index将某一 阅读全文
posted @ 2019-02-28 11:05 Dereen 阅读(424) 评论(0) 推荐(0) 编辑
摘要:Pandas中提供了许多用来处理时间格式文本的方法,包括按不同方法生成一个时间序列,修改时间的格式,重采样等等。 按不同的方法生成时间序列 案例 假如我们现在有美国2015年12月到2017年9月的911求救电话信息。(数据来源: "Emergency 911 Calls" )假如我们需要统计并绘制 阅读全文
posted @ 2019-02-28 11:04 Dereen 阅读(433) 评论(0) 推荐(0) 编辑
摘要:假如我们现在有这样一组数据:星巴克在全球的咖啡店信息,如下图所示。数据来源: "starbucks_store_locations" 。我们想要统计中国每个城市的星巴克商店的数量,那我们应该怎么做呢? <! more 在pandas中,为我们提供了一个处理分组问题的函数 : 结果如下: 假如我们不想 阅读全文
posted @ 2019-02-28 11:02 Dereen 阅读(257) 评论(0) 推荐(0) 编辑
摘要:pandas is an open source, BSD licensed library providing high performance, easy to use data structures and data analysis tools for the Python programm 阅读全文
posted @ 2019-02-28 10:59 Dereen 阅读(339) 评论(0) 推荐(0) 编辑
摘要:为了了解这个原则,首先我们来看一组例子: 这是为什么呢?这里要提到numpy的广播原则: 如果两个数组的 后缘维度(从末尾开始算起的维度) 的 轴长度相符 或 其中一方的长度为1 ,则认为它们是广播兼容的。广播会在 缺失维度 和(或) 轴长度为1的维度 上进行。 在上面的代码中,a的维度是(4,3) 阅读全文
posted @ 2019-02-28 10:53 Dereen 阅读(427) 评论(0) 推荐(0) 编辑
摘要:numpy是一个在Python中做科学计算的基础库,重在数值计算,也是大部分PYTHON科学计算库的基础库,多用于在大型、多维数组上执行数值运算。 数组的定义 数组的形状 以下的代码是在Jupyter Notebook中完成的: 数组的计算 这是为什么呢?这里要提到numpy的广播原则: 如果两个数 阅读全文
posted @ 2019-02-28 10:50 Dereen 阅读(307) 评论(0) 推荐(0) 编辑
摘要:Matplotlib是最流行的Python底层绘图库,主要做数据可视化图表,名字取材于MATLAB。 折线图 结果如图: 散点图 结果如图: 条形图 结果如图: 可以看到竖的条形图在面对文字比较多的时候会出现显示困难的问题,所以这时我们需要用到横向的条形图 结果如图: 直方图 结果如图; 以下是以上 阅读全文
posted @ 2019-02-27 15:17 Dereen 阅读(187) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示