摘要:
导引: 如何进行电影分类 众所周知,电影可以按照题材分类,然而题材本身是如何定义的?由谁来判定某部电影属于哪 个题材?也就是说同一题材的电影具有哪些公共特征?这些都是在进行电影分类时必须要考虑的问 题。没有哪个电影人会说自己制作的电影和以前的某部电影类似,但我们确实知道每部电影在风格 上的确有可能会 阅读全文
摘要:
s1 = ma5 < ma30 T->F金叉 F->T死叉 s2 = ma5 >= ma30 s1 T T F F T T F F s2 F F T T F F T T T F T T T F T F T F F F T F ~(s1 | s2.shift(1)) 问题:如果我从假如我从2010年1 阅读全文
摘要:
导入包 2,导入数据各个海滨城市数据 4,去除没用的列 5,显示最高温度于离海远近的关系(观察多个城市) 观察发现,离海近的可以形成一条直线,离海远的也能形成一条直线。 机器学习 导入sklearn,建立线性回归算法模型对象 阅读全文
摘要:
1,导入包 2,方便大家操作,将月份和参选人以及所在政党进行定义 3,读取文件 4,使用map函数+字典,新建一列各个候选人所在党派party 5,party这一列中有哪些元素 array(['Republican', 'Democrat', 'Reform', 'Libertarian'], dt 阅读全文
摘要:
文件读取 df = pd.read_csv(path='file.csv') 参数:header=None 用默认列名,0,1,2,3... names=['A', 'B', 'C'...] 自定义列名 index_col='A'|['A', 'B'...] 给索引列指定名称,如果是多重索引,可以传 阅读全文
摘要:
1、删除重复元素 1、删除重复元素 1、删除重复元素 1、删除重复元素 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象,每个元素对应一行,如果该行不是第一次出现,则元素为True 使用duplicated()函数检测重复的行,返回元素为布尔类型的Series对象, 阅读全文
摘要:
数据私信我获取 1,导入文件,查看原始数据 2,将人口数据和各州简称数据进行合并 3,将合并的数据中重复的abbreviation列进行删除 4,查看存在缺失数据的列 5,找到有哪些state/region使得state的值为NaN,进行去重操作 6,为找到的这些state/region的state 阅读全文
摘要:
一、Matplotlib基础知识 Matplotlib中的基本图表包括的元素 x轴和y轴 axis水平和垂直的轴线 x轴和y轴刻度 tick刻度标示坐标轴的分隔,包括最小刻度和最大刻度 x轴和y轴刻度标签 tick label表示特定坐标轴的值 绘图区域(坐标系) axes实际绘图的区域 坐标系标题 阅读全文
摘要:
Pandas是用于数据操纵和分析,建立在Numpy之上的。Pandas为Python带来了两种新的数据结构:Pandas Series和Pandas DataFrame,借助这两种数据结构,我们能够轻松直观地处理带标签数据和关系数据。 Pandas功能: 允许为行和列设定标签 可以针对时间序列数据计 阅读全文
摘要:
Numpy支持大量的维度数组和矩阵运算,对数组运算提供了大量的数学函数库! Numpy比Python列表更具优势,其中一个优势便是速度。在对大型数组执行操作时,Numpy的速度比Python列表的速度快了好几百。因为Numpy数组本身能节省内存,并且Numpy在执行算术、统计和线性代数运算时采用了优 阅读全文