10 2021 档案

摘要:一、介绍 Python 中 os 模块包含普遍的操作系统功能。 可以处理文件、目录等操作。 二、常用语法 1.os.name 输出正在使用的平台。 import os os.name # 'nt' -- Windows # 'posix' -- Linux/Unix 2.os.getcwd() 输出 阅读全文
posted @ 2021-10-26 10:00 Hider1214 阅读(232) 评论(0) 推荐(0) 编辑
摘要:一、介绍 通过指定标签名称和相应的轴,或直接指定索引或列名称,删除行或列。 使用多索引时,可以通过指定级别来删除不同级别上的标签。 使用语法: pandas.DataFrame.drop(labels=None, axis=0, index=None, columns=None, level=Non 阅读全文
posted @ 2021-10-21 09:32 Hider1214 阅读(9225) 评论(0) 推荐(0) 编辑
摘要:一、介绍 pandas.MultiIndex.droplevel 用于删除数据框指定的索引,或者列级别的索引。 使用语法: DataFrame.droplevel(self, level, axis=0) -- level 指定级别 -- axis=0 默认按索引 -- axis=1 按列 返回删除 阅读全文
posted @ 2021-10-21 09:15 Hider1214 阅读(5498) 评论(0) 推荐(1) 编辑
摘要:一、介绍 类似于 range 产生等差数列,date_range 产生的是等差时间序列。 生成一个固定频率的时间索引,必须指定 start、end、periods 中的两个参数值,否则报错。 使用语法: pandas.date_range(start=None, end=None, periods= 阅读全文
posted @ 2021-10-18 23:57 Hider1214 阅读(3390) 评论(0) 推荐(0) 编辑
摘要:日常工作中,可能遇到每天生产记录的日志数据,但并非每一天都会产生数据,中间可能间隔某几天为空,此时需要生成一个连续时间序列。应该怎么办? 先构造一个连续的时间序列 将日志数据 left join 到生成的序列上 开始实操: import pandas as pd import numpy as np 阅读全文
posted @ 2021-10-18 16:04 Hider1214 阅读(596) 评论(0) 推荐(0) 编辑
摘要:MD5 算法严格上来说,不算是一种加密算法,而是一种哈希算法。 在 MD5 中没有密钥和密文的概念,没有解密一说。 MD5 是一种有损压缩,非对称加密算法,无法进行还原。 网上关于 MD5 的解密大部分都是码表匹对,而不是破解。 在 Python3 标准库中,已经移除了 md5, 关于 hash 加 阅读全文
posted @ 2021-10-14 00:05 Hider1214 阅读(2604) 评论(0) 推荐(0) 编辑
摘要:pandas 中的 sort_values 函数类似于 SQL 中的 order by,可以将数据集依据特定的字段进行排序。 可根据列数据,也可以根据行数据排序。 一、介绍 使用语法为: df.sort_values(by='xxx', axis=0, ascending=True, inplace 阅读全文
posted @ 2021-10-13 00:43 Hider1214 阅读(5075) 评论(0) 推荐(1) 编辑
摘要:一、问题提出 实现如图所示的转换。 二、解决问题 1.方法一:堆叠 # 构建测试数据 import pandas as pd df = pd.DataFrame({'name':['a', 'b,c'], 'age':[15, 16]}) print(df) df.set_index('age')[ 阅读全文
posted @ 2021-10-12 23:58 Hider1214 阅读(69) 评论(0) 推荐(0) 编辑
摘要:drop_duplicates 方法实现对数据框 DataFrame 去除特定列的重复行,返回 DataFrame 格式数据。 一、使用语法及参数 使用语法: DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ig 阅读全文
posted @ 2021-10-12 23:23 Hider1214 阅读(2244) 评论(0) 推荐(0) 编辑
摘要:字典是 Python 中很重要的数据类型,有很多内置函数需要了解。 1.dict.clear 清除字典中所有键值对。 dict = {'a':10, 'b':20, 'c':30} dict.clear() print(dict) # {} 2.dict.get 如果键存在于字典中,则返回该键的值。 阅读全文
posted @ 2021-10-12 10:13 Hider1214 阅读(275) 评论(0) 推荐(0) 编辑
摘要:最简单、直观的认识,将 yield 看做 return 对待,只是 return 返回一个值,而 yield 返回一个生成器。 要理解 yield 的作用,必须理解生成器是什么? 在理解生成器之前,必须先理解迭代器。 一、迭代器 逐项读取列表,称为迭代。 mylist = [1, 2, 3] for 阅读全文
posted @ 2021-10-12 00:51 Hider1214 阅读(202) 评论(0) 推荐(0) 编辑
摘要:使用 scikit-learn 机器学习包实现最基础的线性回归模型。 安装 scikit-learn 包,或者 Anaconda 工具箱自带。 pip install scikit-learn 构建训练数据。 from random import randint train_set_limit = 阅读全文
posted @ 2021-10-12 00:10 Hider1214 阅读(167) 评论(0) 推荐(0) 编辑
摘要:原始数据为 csv 文件。 data ''' date,temperature,humidity 07/01/21,95,50 07/02/21,94,55 07/03/21,94,56 ''' 一、读取时指定索引列 默认索引从0开始,可通过 index_col 设置索引列。 import os o 阅读全文
posted @ 2021-10-11 17:33 Hider1214 阅读(653) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示