10 2021 档案
摘要:异常情况 编辑过程中链接出现中断,再次链接编辑文件会提示相应信息 解决方式:删除显示的隐藏文件 rm -f .文件名.swp 出现的原因: 1.编辑状态突然出现了中断 2.文件被多个人使用 总结:出现了隐藏文件,没有及时删除 vi -r oldboy.txt 目录结构说明 结构特点说明 1.linu
阅读全文
摘要:linux操作系统的安装第二部分(重要) 写了网卡文件ifcfg-eth0 不写ifcfg-ens33 如果报错: 安装虚拟主机: 网络链接模式 虚拟网络编辑器说明 桥接模式(可以访问互联网) 配置的地址信息和物理主机网段地址信息相同,容易造成地址冲突 NAT模式(可以访问互联网) 配置的地址信息和
阅读全文
摘要:贝叶斯模型 通过已知类别的训练数据集,计算样本的先验概率,然后利⽤⻉叶斯 概率公式测算未知类别样本属于某个类别的后验概率 最终以最⼤后验概率所对应的类别作为样本的预测值 1.高斯贝叶斯分类器 适用于自变量为连续的数值类型的情况 2.多项式贝叶斯分类器 适用于自变量为离散型类型的情况(非数字类型) 3
阅读全文
摘要:缺失值处理 1.df.isnull 2.df.fillna 3.df.dropna 数据汇总 透视表功能 pd.pivot_table(data, values=None, index=None, columns=None, aggfunc='mean', fill_value=None, marg
阅读全文
摘要:模型的假设检验(F与T) F检验:提出原假设和备择假设 之后计算统计量与理论值 最后比较 (F检验主要检验的是模型是否合理) # 导⼊第三⽅模块 import numpy as np # 计算建模数据中因变量的均值 ybar=train.Profit.mean() # 统计变量个数和观测个数 p=m
阅读全文
摘要:线性回归模型 重要名词解释: 数据符号网站: https://symbol.91maths.com/ 因变量与自变量: 函数关系式中,某些特定的数会随另一个(或另几个)会变动的数的变动而变动 可以自己随意调整变动数值的是自变量,用来展示变化的是因变量 ep:y = 2x+3 y是因变量,x是自变量
阅读全文
摘要:数据清洗的概念 类比定义 数据分析过程 做菜过程 明确需求 明确做什么菜 收集采集 去菜市场买菜 数据清洗 洗菜切菜配菜 数据分析 炒菜 数据报告+数据可视化 拍照发朋友圈吃菜 专业定义 数据清洗是从记录表,表格,数据库中检查,纠正或删除损坏或不准确记录的过程 专业名称 脏数据 没有经过处理自身含有
阅读全文
摘要:解决作图乱码 jupyter 画图轴标题不显示中文(显示方框)_singghet的博客-CSDN博客 文件这里面有:C:\Windows\Fonts matplotlib绘图 import matplotlib.pyplot as plt 饼图 plt.pie 垂直条形图 plt.bar 水平条形图
阅读全文
摘要:缺失值处理 缺失值的识别与处理 1.df.isnull 2.df.fillna 3.df.dropna data05 = pd.read_excel(r'data_test05.xlsx') data05.head() data05.isnull() # 统计每个数据项是否有缺失 data05.is
阅读全文
摘要:数据分析 数据分析的概念 什么是数据分析 就是从现有的数据中挖掘出价值 为什么数据分析需要学python python简单易学,并且是数据分析必备的语言 数据分析的工作流程 以下工作流程是一般情况下常见流程,也有可能会出现偏差 1.需求分析 搞明白到底要分析什么数据,以什么方式分析,想要什么样的结果
阅读全文
摘要:series数据操作 import pandas as pd res = pd.Series([111,222,333,444]) 增 res['a'] = 123 查 res.loc[1] 改 res[0] = 1 删 del res[0] 算术运算符 add 加(add) sub 减(subst
阅读全文
摘要:numpy小练习 1.计算数组每一行和每一列的中位数(不能使用axis参数) import numpy as np res =np.array([ [ 80.5, 60., 40.1, 20., 90.7], [ 10.5, 30., 50.4, 70.3, 90.], [ 35.2, 35., 3
阅读全文
摘要:科普 很多编程语言对数字精确度不是很敏感,python亦是如此 1234567890.0987654321 1234567890.01 但是python又可以做人工智能,机器学习,量化交易,数据分析等高精确度的工作 内部其实就是通过相应的模块来实现 numpy简介 1.numpy是高性能科学计算和数
阅读全文
摘要:数据分析的概念 什么是数据分析 就是从现有的数据中挖掘出价值 数据分析应用领域 商品推荐 eg:在淘宝上搜索了一款产品之后,接下来就会疯狂给你推荐相关产品 量化交易 股票,期货等数据分析 短视频推送 抖音,今日头条等短视频 (数据分析绝对是未来所有公司不可或缺的岗位,目前社会上获取数据方法太多了,这
阅读全文
摘要:思路 英雄资料列表页-英雄介绍-王者荣耀官方网站-腾讯游戏 (qq.com) 1.先进入官网的英雄/皮肤界面 2.但是这个界面是不显示皮肤的,所以需要先找找皮肤在哪,先随便点个英雄头像进去 3.然后发现里面的界面的结构,是直接将皮肤图片作为背景,然后点击右下角选择皮肤图片 那总之先打开网页检查,看一
阅读全文
摘要:文档操作补充 涉及到数据的嵌套查找,支持直接点键或者索引 db.t1.deleteOne({'addr.cpunytry':'japan'}) db.t1.deleteOne({'hobby.1':'tea'}) .键.索引.索引.键.键 可以无限制的往下点 用户权限管理 (涉及到用户权限相关 引号
阅读全文
摘要:爬虫框架之Scrapy 框架:别人提前给你搭建好了基本架构,具备了一定的功能 Scrapy是网络爬虫中使用频率最高,功能最为完善的框架 1.下载scrapy框架 pip3 install scrapy (mac本一般直接下载即可,但是Windows电脑可能会出错) Windows电脑如果下载报错并且
阅读全文
摘要:python数据分析 1.IT基础 2.python 3.数据库MySQL 4.python网络爬虫 5.数据分析 6.操作系统 7.数据分析相关软件 python数据分析(日志)
阅读全文
摘要:MySQL基础 1.MySQL安装 2.基本SQL语句 3.MySQL基本数据类型 MySQL键 1.MySQL主键外键 2.MySQL数据查询 3.MySQL多表查询 4.pymysql模块 5.pymysql
阅读全文
摘要:Python基础 1.编程语言 2.python基础 3.python数据 4.python运算符 5.python文件操作 python文件 1.python文件操作 2.python文件操作补充 3.python函数参数 4.python模块 5.python各种模块 6.python对象
阅读全文
摘要:计算机基础 1.typora基本用法 2.计算机发展史 3.认识计算机 4.计算机网络 5.windows DOS命令 6.windows DOS其他命令操作 7.进程 前端基础 1.HTML超文本标记语言 2.body内常见标签补充 3.css选择器 4.css补完 5.网页制作
阅读全文
摘要:网络爬虫 1.网络爬虫简介 2.正则表达式 3.requests模块 4.cookie 5.网络爬虫练习 6.bs4模块 7.网络爬虫练习题 8.openpyxl模块 9.梨视频爬取流程 10.网络爬虫练习题2 11.Xpath解析器 12.selenuim模块 13.selenuim网页操作 14
阅读全文
摘要:百度自动登录 from selenium import webdriver import time # 1.使用谷歌浏览器访问百度首页 bro = webdriver.Chrome() bro.get('https://www.baidu.com/') # 2.查找页面上的登录按钮 login_ta
阅读全文

浙公网安备 33010602011771号