陈玉兰

2021年6月14日

摘要：使用数据：mushrooms.csv mushrooms_o.csv visuals.py 阅读全文

posted @ 2021-06-14 22:27 陈玉兰阅读(583) 评论(0) 推荐(0) 编辑

2021年5月17日

摘要： ''' 已有word_index，格式如下 {'word1': 1, 'word2': 2, 'word3': 3, ... } ''' # 快速互换 index_word_map = {v:k for k,v in word_index.items()} ''' {1:'word1', 2:'wo 阅读全文

posted @ 2021-05-17 22:31 陈玉兰阅读(213) 评论(0) 推荐(0) 编辑

Python 去掉数组（array）中的零/过滤数据中的零/提取数据中的非零

摘要：思路：使用mask import numpy as np # 创建一串数 data = np.array([0,0,0,135,30,125]) # 目的是提取后面三个非零数据 mask = data!=0 #[False False False True True True] new_data = 阅读全文

posted @ 2021-05-17 22:11 陈玉兰阅读(5059) 评论(0) 推荐(1) 编辑

2021年5月13日

Juypter Notebook 保存图片 matplotlib plt.savefig 记录时间设置dpi

摘要： import matplotlib.pyplot as plt # 第一种，在savefig函数那里设置像素 plt.figure(figsize=(5, 5)) #设置画布尺寸——正方形 plt.scatter(data[:, 0], data[:, 1],label="your label") 阅读全文

posted @ 2021-05-13 22:14 陈玉兰阅读(1883) 评论(0) 推荐(0) 编辑

2021年5月8日

新建一个空的DataFrame 表头与旧DataFrame 一致

摘要： newdf = pd.DataFrame(data=None, columns=olddf.columns) #其中olddf是先前处理完毕的数据 #不使用copy()是因为newdf中不需要所有olddf中的数据，而是需要根据条件筛选并添加 for i in range(...): tmpdf = 阅读全文

posted @ 2021-05-08 12:32 陈玉兰阅读(533) 评论(0) 推荐(0) 编辑

2021年5月7日

Python 保存数据为excel

摘要：核心：使用DataFrame的to_excel函数 import pandas as pd datadf = pd.DataFrame(data) datadf.to_excel('excel_name.xlsx',header=True, index=True) #保留列名，新建一列index，从阅读全文

posted @ 2021-05-07 19:53 陈玉兰阅读(337) 评论(0) 推荐(0) 编辑

聚类 sklearn contingency matrix 权变矩阵解释

摘要： >>> from sklearn.metrics.cluster import contingency_matrix >>> x = ["a", "a", "a", "b", "b", "b"] >>> y = [0, 0, 1, 1, 2, 2] >>> contingency_matrix(x, 阅读全文

posted @ 2021-05-07 11:52 陈玉兰阅读(834) 评论(0) 推荐(0) 编辑

2021年5月6日

随机生成指定范围内指定个数的整数/生成随机整数

摘要：关键：使用numpy import numpy as np np.random.randint(0, high=100, size=50) #随机生成0到100之间的不重复的整数，个数为50个对比：生成固定整数 l_1 = [1]*20 #[1, 1, 1, ..., 1] l_2 = [2]*2 阅读全文

posted @ 2021-05-06 13:08 陈玉兰阅读(340) 评论(0) 推荐(0) 编辑

2021年5月5日

对一串数字一个列表（list）一个array 一次性输出所有基本统计信息（最值、均值...）

摘要：核心：数据转成pandas中的Series import pandas as pd s = pd.Series([1, 2, 3, 4]) print(s.describe()) 阅读全文

posted @ 2021-05-05 16:37 陈玉兰阅读(75) 评论(0) 推荐(0) 编辑

Python 保存任何格式的数据输出 pickle 使用

摘要： import pickle as pkl #处理数据得到data #保存 f = open("file_name.pickle",'wb') pkl.dump(data, f) f.close() #读取 tmp = open("file_name.pickle", 'rb') data = pkl 阅读全文

posted @ 2021-05-05 16:24 陈玉兰阅读(321) 评论(0) 推荐(0) 编辑

Welcome : )

公告