摘要: 使用数据:mushrooms.csv mushrooms_o.csv visuals.py 阅读全文
posted @ 2021-06-14 22:27 陈玉兰 阅读(577) 评论(0) 推荐(0) 编辑
摘要: ''' 已有word_index,格式如下 {'word1': 1, 'word2': 2, 'word3': 3, ... } ''' # 快速互换 index_word_map = {v:k for k,v in word_index.items()} ''' {1:'word1', 2:'wo 阅读全文
posted @ 2021-05-17 22:31 陈玉兰 阅读(209) 评论(0) 推荐(0) 编辑
摘要: 思路:使用mask import numpy as np # 创建一串数 data = np.array([0,0,0,135,30,125]) # 目的是提取后面三个非零数据 mask = data!=0 #[False False False True True True] new_data = 阅读全文
posted @ 2021-05-17 22:11 陈玉兰 阅读(4990) 评论(0) 推荐(1) 编辑
摘要: import matplotlib.pyplot as plt # 第一种,在savefig函数那里设置像素 plt.figure(figsize=(5, 5)) #设置画布尺寸——正方形 plt.scatter(data[:, 0], data[:, 1],label="your label") 阅读全文
posted @ 2021-05-13 22:14 陈玉兰 阅读(1860) 评论(0) 推荐(0) 编辑
摘要: newdf = pd.DataFrame(data=None, columns=olddf.columns) #其中olddf是先前处理完毕的数据 #不使用copy()是因为newdf中不需要所有olddf中的数据,而是需要根据条件筛选并添加 for i in range(...): tmpdf = 阅读全文
posted @ 2021-05-08 12:32 陈玉兰 阅读(528) 评论(0) 推荐(0) 编辑
摘要: 核心:使用DataFrame的to_excel函数 import pandas as pd datadf = pd.DataFrame(data) datadf.to_excel('excel_name.xlsx',header=True, index=True) #保留列名,新建一列index,从 阅读全文
posted @ 2021-05-07 19:53 陈玉兰 阅读(336) 评论(0) 推荐(0) 编辑
摘要: >>> from sklearn.metrics.cluster import contingency_matrix >>> x = ["a", "a", "a", "b", "b", "b"] >>> y = [0, 0, 1, 1, 2, 2] >>> contingency_matrix(x, 阅读全文
posted @ 2021-05-07 11:52 陈玉兰 阅读(818) 评论(0) 推荐(0) 编辑
摘要: 关键:使用numpy import numpy as np np.random.randint(0, high=100, size=50) #随机生成0到100之间的不重复的整数,个数为50个 对比:生成固定整数 l_1 = [1]*20 #[1, 1, 1, ..., 1] l_2 = [2]*2 阅读全文
posted @ 2021-05-06 13:08 陈玉兰 阅读(335) 评论(0) 推荐(0) 编辑
摘要: 核心:数据转成pandas中的Series import pandas as pd s = pd.Series([1, 2, 3, 4]) print(s.describe()) 阅读全文
posted @ 2021-05-05 16:37 陈玉兰 阅读(75) 评论(0) 推荐(0) 编辑
摘要: import pickle as pkl #处理数据得到data #保存 f = open("file_name.pickle",'wb') pkl.dump(data, f) f.close() #读取 tmp = open("file_name.pickle", 'rb') data = pkl 阅读全文
posted @ 2021-05-05 16:24 陈玉兰 阅读(318) 评论(0) 推荐(0) 编辑