摘要: 一、矩阵 奇异值分解及作用 行列式 线性代数 阅读全文
posted @ 2020-06-08 19:55 败家小林 阅读(327) 评论(0) 推荐(0) 编辑
摘要: 本福特定律 概率公式 贝叶斯公式 重要分布 Beta分布 事件的独立性 期望与方差 协方差 Pearson相关系数 切比雪夫不等式 大数定律 中心极限定理 最大似然估计 阅读全文
posted @ 2020-06-03 22:33 败家小林 阅读(281) 评论(0) 推荐(0) 编辑
摘要: 数学分析 1、知识回忆 2、导数 3、梯度 阅读全文
posted @ 2020-06-01 23:01 败家小林 阅读(294) 评论(0) 推荐(0) 编辑
摘要: Matplotlib 包:imoprt matplotlib.pyplot as plt 散点图 作用:显示两变量相关性 正相关 负相关 不相关 plt.scatter(x,y) 参数 点的大小:s=面积大小 颜色:c=‘r’ 点的形状:marker=’<’ 透明度:alpha= 折线图 作用:观察 阅读全文
posted @ 2020-05-27 21:19 败家小林 阅读(197) 评论(0) 推荐(0) 编辑
摘要: ipython 查看相关函数和补全 输入库中的部分函数名,按tab 如np.r ,按tab 查看文档 函数名? 直接执行shell命令 特殊命令 %run %timeit 更多ipython命令:%quickref 魔术命令:%magic notebook pandas Series (一行或一列) 阅读全文
posted @ 2020-05-20 20:36 败家小林 阅读(124) 评论(0) 推荐(0) 编辑
摘要: numpy.array 属性 维数:.ndim 形状:.shape 总元素个数:.size 创建数组 元素在指定范围的数组 np.arange() 类似range 可选参数step 全零数组 np.zeros((形状)) 全一数组 np.ones((形状)) 改变数组形状(浅拷贝) array.re 阅读全文
posted @ 2020-05-14 23:35 败家小林 阅读(109) 评论(0) 推荐(0) 编辑
摘要: 一、人工智能概念 人工智能 分类 机器学习 深度学习 数据挖掘 模式识别 落地 依靠机器学习 数据 即观测值 信息 可信的数据 数据分析 从数据到信息的整理、筛选和加工过程 数据挖掘 对信息进行价值化的分析 用机器学习的方法进行数据挖掘 机器学习为方法 数据挖掘为任务 模式识别也是任务 机器学习 机 阅读全文
posted @ 2020-05-12 22:00 败家小林 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 一、大数据的4v特征 数据量大 TB PB ZB HDFS分布式文件系统 数据种类多 结构化数据 Mysql为主的存储和处理 非结构化数据 图像、音频等 HDFS、MR、Hive 半结构化数据 XML形式、HTML形式 HDFS、MR、Hive、Spark 速度快 数据增长速度快 TB PB ZB 阅读全文
posted @ 2020-05-08 22:38 败家小林 阅读(279) 评论(0) 推荐(0) 编辑
摘要: shell脚本为文本文件 文件通常以.sh结尾 第一行:指定用哪个程序编译执行 ! /bin/bash ! /bin/sh 注释: 变量名:以字母或下划线开头,大小写敏感 变量 本地变量 环境变量(全局变量) 大写 export LANG 赋值 等号两边不能有空格 给变量赋空值,在等号后加换行符 显 阅读全文
posted @ 2020-05-07 21:57 败家小林 阅读(121) 评论(0) 推荐(0) 编辑
摘要: 一、查看操作 查看系统:uname 查看内核版本:uname r 查看cpu信息:cat /proc/cpuinfo 查看内存信息:cat /proc/meminfo 日期: date 日期加时区:date R 日历:cal 年份 时间日期设置(root):date s 日期/时间 查看分支目录:d 阅读全文
posted @ 2020-05-04 21:17 败家小林 阅读(156) 评论(0) 推荐(0) 编辑