摘要:
使用数据:mushrooms.csv mushrooms_o.csv visuals.py 阅读全文
摘要:
''' 已有word_index,格式如下 {'word1': 1, 'word2': 2, 'word3': 3, ... } ''' # 快速互换 index_word_map = {v:k for k,v in word_index.items()} ''' {1:'word1', 2:'wo 阅读全文
摘要:
思路:使用mask import numpy as np # 创建一串数 data = np.array([0,0,0,135,30,125]) # 目的是提取后面三个非零数据 mask = data!=0 #[False False False True True True] new_data = 阅读全文
摘要:
import matplotlib.pyplot as plt # 第一种,在savefig函数那里设置像素 plt.figure(figsize=(5, 5)) #设置画布尺寸——正方形 plt.scatter(data[:, 0], data[:, 1],label="your label") 阅读全文
摘要:
newdf = pd.DataFrame(data=None, columns=olddf.columns) #其中olddf是先前处理完毕的数据 #不使用copy()是因为newdf中不需要所有olddf中的数据,而是需要根据条件筛选并添加 for i in range(...): tmpdf = 阅读全文
摘要:
核心:使用DataFrame的to_excel函数 import pandas as pd datadf = pd.DataFrame(data) datadf.to_excel('excel_name.xlsx',header=True, index=True) #保留列名,新建一列index,从 阅读全文
摘要:
>>> from sklearn.metrics.cluster import contingency_matrix >>> x = ["a", "a", "a", "b", "b", "b"] >>> y = [0, 0, 1, 1, 2, 2] >>> contingency_matrix(x, 阅读全文
摘要:
关键:使用numpy import numpy as np np.random.randint(0, high=100, size=50) #随机生成0到100之间的不重复的整数,个数为50个 对比:生成固定整数 l_1 = [1]*20 #[1, 1, 1, ..., 1] l_2 = [2]*2 阅读全文