随笔分类 -  python

1 2 3 4 5 ··· 7 下一页

Python
python在导入模块时,即import时究竟有哪些动作?
摘要:python在导入模块时,即import时究竟有哪些动作?在python中,导入并非只是把一个文本文件插入到另一个文件。导入其实是运行时的运算,程序第一次导入指定文件时,会执行以下三个步骤: 1、找到模块文件 2、编译成位码(即pyc文件) 3、执行模块的代码来创建其所定义的变量(你没看错,导入时代 阅读全文

posted @ 2022-08-15 18:59 多一点 阅读(318) 评论(0) 推荐(0) 编辑

利用numpy select 和numpy where 做pandas数据处理
摘要:还是最近的那个项目,最后收尾阶段遇到这样一个问题:根据表格每一行某几列的数据进行条件筛选后并生成新的一列数据。 像下面这个示例一样👇: 需要根据每一行的“ 生日”,“地址”,“保险”是否有值来生成新的一列字段,比如叫“完整度”字段。 就拿王佳来说,因为他的 “保险”字段是空值,但是“地址”和“生日 阅读全文

posted @ 2022-07-07 18:57 多一点 阅读(231) 评论(0) 推荐(0) 编辑

多线程中ThreadPoolExecutor.map()中传递多个参数
摘要:问题如下: 阅读全文

posted @ 2021-12-27 14:55 多一点 阅读(889) 评论(0) 推荐(0) 编辑

利用pandas,BytesIO,zipfile打包csv文件,生成压缩文件
摘要:import time import pandas as pd import zipfile from io import BytesIO, StringIO memory_file = BytesIO() # 创建二进制内存文件 dl_name = '{}.zip'.format("文件下载_" 阅读全文

posted @ 2021-12-10 18:28 多一点 阅读(283) 评论(0) 推荐(0) 编辑

python collection系列博客之一deque对象
摘要: 阅读全文

posted @ 2020-11-07 20:56 多一点 阅读(169) 评论(0) 推荐(0) 编辑

python参数的可变参数与关键词参数
摘要:# 可变参数与关键词参数def can_form_triangle(a, b, c): print(f'a = {a}, b = {b}, c = {c}') return a + b > c and b + c > a and a + c > b'''1. 在没有特殊处理的情况下,函数的参数都是位 阅读全文

posted @ 2020-11-07 19:52 多一点 阅读(177) 评论(0) 推荐(0) 编辑

pip国内访问加速配置清华源
摘要:pip 是 python 必不可少的的包管理工具,但是要在国内用得爽,必须要配置镜像源。 有哪些镜像站可用,以及如何配置,网上都有很多分享了。 我常用的是 阿里云镜像站。 这里有一点比较麻烦的地方,就是是 Linux 和 Windows 环境下的 pip 配置文件的名字和位置都不同,经常混淆。 今天 阅读全文

posted @ 2020-11-02 09:36 多一点 阅读(561) 评论(0) 推荐(0) 编辑

pandas pivot_table或者groupby实现sql 中的count distinct 功能
摘要:pandas pivot_table或者groupby实现sql 中的count distinct 功能 .dataframe tbody tr th:only of type { vertical align: middle; } .dataframe tbody tr th { vertical 阅读全文

posted @ 2019-03-28 11:47 多一点 阅读(4011) 评论(0) 推荐(1) 编辑

最近遇到的问题,待整理
摘要:1. 介绍在PE的产筛算法针对自己的项目,上采样,下采样如果适用? 2. 自己项目中,Pandas处理样本数据量(百万级) 3. 是否熟练适用sql,我回答说大部分是用的mongodb 4. 是否适用过分布式图计算,大数据平台 5. t test 如何解释 6. 显著性检验,P value 如何解释 阅读全文

posted @ 2019-01-30 15:54 多一点 阅读(410) 评论(0) 推荐(0) 编辑

pandas 处理文本数据
摘要:常规的字符串操作 0 A 1 B 2 C 3 AaBa 4 Baca 5 NaN 6 dog 7 cat dtype: object 0 a 1 b 2 c 3 aaba 4 baca 5 NaN 6 dog 7 cat dtype: object 0 A 1 B 2 C 3 AABA 4 BACA 阅读全文

posted @ 2018-12-11 23:42 多一点 阅读(1926) 评论(0) 推荐(0) 编辑

pandas 基础操作 更新
摘要:<! TOC "创建一个Series,同时让pandas自动生成索引列" "创建一个DataFrame数据框" "查看数据" "数据的简单统计" "数据的排序" "选择数据(类似于数据库中sql语句)" "另外可以使用标签来选择" "通过位置获取数据" "布尔值索引" "设定数值(类似于sql up 阅读全文

posted @ 2018-12-09 20:42 多一点 阅读(466) 评论(0) 推荐(0) 编辑

pandas 基础
摘要:<! TOC "创建一个Series ,同时让pandas自动生成索引列" "创建一个DataFrame数据框" "查看数据" "数据的简单统计" "数据的排序" "选择数据(类似于数据库中sql语句)" "另外可以使用标签来选择" "通过位置获取数据" "布尔值索引" "设定数值(类似于sql u 阅读全文

posted @ 2018-11-18 21:48 多一点 阅读(323) 评论(1) 推荐(1) 编辑

美团店铺评价语言处理以及分类(tfidf,SVM,决策树,随机森林,Knn,ensemble)
摘要:第一篇 "数据清洗与分析部分" 第二篇 "可视化部分" , 第三篇 "朴素贝叶斯文本分类" <! TOC "支持向量机分类" "支持向量机 网格搜索" "临近法" "决策树" "随机森林" "bagging方法" <! /TOC .dataframe tbody tr th:only of type 阅读全文

posted @ 2018-09-20 00:04 多一点 阅读(2246) 评论(0) 推荐(0) 编辑

Python变量访问权限控制
摘要:oop1.py文件代码 oop2.py文件代码 另外双下划线变量,类本身可以访问__变量,但是在其它作用域不行 可以通过_classname__变量来访问 在函数方法内,class内,没有用self修饰的变量;【又为临时变量,只在函数内部有效,obj不能访问】 全局变量:在模块内,所有函数方法外,c 阅读全文

posted @ 2018-09-11 18:01 多一点 阅读(1761) 评论(0) 推荐(0) 编辑

加州房价预测数据预处理
摘要:<! @import "[TOC]" {cmd="toc" depthFrom=1 depthTo=6 orderedList=false} <! code_chunk_output "本文是该系列读书笔记的第二章数据预处理部分" "获取数据" "数据的初步分析,数据探索" "地理分布" "数据特征 阅读全文

posted @ 2018-09-07 09:45 多一点 阅读(3956) 评论(0) 推荐(0) 编辑

flask下载文件中文IE,Edge,Safari文件名乱码
摘要:flask(0.11.2)+python3.6 兼容各个主流浏览器,已经过各种测试(chrome,firefox,safari,IE,Edge) quote是将文件名urlencode化,然后以适应Edge浏览器 阅读全文

posted @ 2018-08-30 11:22 多一点 阅读(1014) 评论(0) 推荐(0) 编辑

numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组
摘要:numpy 中的reshape,flatten,ravel 数据平展,多维数组变成一维数组 import numpy as np 使用array对象 arr1=np.arange(12).reshape(3,4) print(arr1) print(type(arr1)) [[ 0 1 2 3] [ 阅读全文

posted @ 2018-08-28 23:54 多一点 阅读(12537) 评论(1) 推荐(1) 编辑

numpy 中不常用的一些方法
摘要:作者:代码律动链接:https://zhuanlan.zhihu.com/p/36303821来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 挑战 1:引入 numpy 并查看 numpy 的版本。 要求:这是第一步,以后我们使用 numpy 时都将用别名 np。 # 阅读全文

posted @ 2018-08-27 14:17 多一点 阅读(1360) 评论(0) 推荐(0) 编辑

pandas.DataFrame对行和列求和及添加新行和列
摘要:pandas.DataFrame对行和列求和及添加新行和列 导入模块: 生成DataFrame数据 计算各列数据总和并作为新列添加到末尾 计算各行数据总和并作为新行添加到末尾 最终数据结果: 阅读全文

posted @ 2018-08-27 13:49 多一点 阅读(8726) 评论(0) 推荐(1) 编辑

numpy中数据合并,stack ,concentrate,vstack,hstack
摘要:在python的numpy库中有一个函数np.stack(), 看过一些博文后觉得别人写的太复杂,然后自己有了一些理解之后做了一些比较简单的解释 np.stack 首先stack函数用于堆叠数组,其调用方式如下所示: np.stack(arrays,axis=0) 其中arrays即需要进行堆叠的数 阅读全文

posted @ 2018-08-27 13:44 多一点 阅读(11422) 评论(0) 推荐(0) 编辑

1 2 3 4 5 ··· 7 下一页

导航

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8
点击右上角即可分享
微信分享提示