11 2021 档案
摘要:Numpy数组操作 数组广播机制: 数组与数的计算: 在Python列表中,想要对列表中所有的元素都加一个数,要么采用map函数,要么循环整个列表进行操作。但是NumPy中的数组可以直接在数组上进行操作。示例代码如下: import numpy as np a1 = np.random.random
阅读全文
摘要:利用IDEA进行克隆项目: 克隆到本地后: 这个目录既变成了一个本地仓库,又变成了工作空间。 解决冲突 【1】在你push以后,有冲突的时候提示合并操作: 合并: 如何避免冲突 【1】团队开发的时候避免在一个文件中改代码 【2】在修改一个文件前,在push之前,先pull操作
阅读全文
摘要:因为他们是两个不同的项目,要把两个不同的项目合并,git需要添加一句代码,在 git pull 之后,这句代码是在git 2.9.2版本发生的,最新的版本需要添加 --allow-unrelated-histories 告诉 git 允许不相关历史合并。 假如我们的源是origin,分支是maste
阅读全文
摘要:IDEA集成Git: 本地库的初始化操作: 本地库初始化完成了,生成了.git目录: 添加到暂存区,再提交到本地库操作; add +commit: 当你更改内容以后,前面跟本地库内容不一致的地方会显示绿色:
阅读全文
摘要:免密操作: 【1】进入用户的主目录中: 【2】执行命令,生成一个.ssh的目录: keygen > key generation 注意:C要大写 后面的邮箱,是你的github注册的账号的时候对应的邮箱 三次回车确认默认值即可 发现在.ssh目录下有两个文件: 【3】打开id_rad.pub文件,将
阅读全文
摘要:【1】得到远程库的地址: 地址: https://github.com/zhaoshanshan3366/GitResp2.git 【2】进行fork操作: 进入到账号后:复制地址:https://github.com/zhaoshanshan3366/GitResp2.git 然后点击下面的for
阅读全文
摘要:协同开发合作时冲突的解决办法 【1】 向远程库推送数据: 【2】 做了一个拉取操作: 到这里为止,现在远程合作没有任何问题。 现在操作同一个文件的同一个位置的时候,就会引起冲突: 【3】 再次做了推送操作: 改动位置: 【4】 改动Test.txt中内容,然后进行推送: 发现 推送失败! 在冲突的情
阅读全文
摘要:远程库修改的拉去操作 【1】拉取操作 pull操作,相当于 fetch+merge 【2】项目经理先先确认远程库内容是否更新了: 【3】项目经理进行拉取: (1)先是抓取操作:fetch: 在抓取操作执行后,只是将远程库的内容下载到本地,但是工作区中的文件并没有更新。工作区中还是原先的内容: 抓取后
阅读全文
摘要:邀请加入团队,push操作 【1】更新本地库信息: 【2】push内容到远程库中去: 发现可以直接push进去,并没有让我录入账号密码,或者也没有提示错误 - --》结果 很诡异 原因:git使用的时候在本地有缓存: 将缓存删除: 现在再次重新push,发现出错了: 必须要加入团队: 登录项目经理的
阅读全文
摘要:GitHub 1、初始化本地仓库 2、创建远程库 【1】创建远程库 【2】录入信息: 【3】完成状态: 3、在本地创建远程库地址别名 远程库的地址: 点击进入: 远程库地址比较长,每次复制比较麻烦 https://github.com/zhaoshanshan3366/GitResp2.git 在G
阅读全文
摘要:分支_冲突问题 【1】进入branch01分支,增加内容: 【2】将分支切换到master: 然后在主分支下 加入内容: 【3】再次切换到branch01分支查看: 【4】将branch01分支 合并到 主分支 : (1)进入主分支: (2)将branch01中的内容和主分支内容进行合并: 查看文件
阅读全文
摘要:分支 【1】什么是分支: 在版本控制过程中,使用多条线同时推进多个任务。这里面说的多条线,就是多个分支。 【2】通过一张图展示分支: 【3】分支的好处: 同时多个分支可以并行开发,互相不耽误,互相不影响,提高开发效率 如果有一个分支功能开发失败,直接删除这个分支就可以了,不会对其他分支产生任何影响。
阅读全文
摘要:Git常用命令 diff命令 【1】先创建一个文件,添加到暂存区,再提交到本地库: 【2】更改工作区中Test3.txt中内容,增加内容: 导致:工作区 和 暂存区 不一致,比对: 总结: git diff [文件名] 》 将工作区中的文件和暂存区中文件进行比较 多个文件的比对: 总结:git di
阅读全文
摘要:Git常用命令 【1】新建 一个Test2.txt文件 【2】将它add到暂存区中 【3】再通过commit提交到本地库 【4】删除工作区中的Test2.txt 【5】将删除操作同步到暂存区: 【6】将删除操作同步到本地库: 【7】查看日志: 【8】找回本地库中删除的文件,实际上就是将历史版本切换到
阅读全文
摘要:Git常用命令 reset命令:前进或者后退历史版本 复制:在终端中选中就是复制了 粘贴: 右键:paste hard参数/mixed参数/soft参数 【1】hard参数: git reset --hard [索引] 本地库的指针移动的同时,重置暂存区,重置工作区 【2】mixed参数: 本地库的
阅读全文
摘要:Git常用命令 log命令: git log 可以让我们查看提交的,显示从最近到最远的日志 当历史记录过多的时候,查看日志的时候,有分页效果,分屏效果,一页展示不下: 下一页:空格 上一页: b 到尾页了 ,显示END 退出:q 日志展示方式: 【1】方式1:git log 》分页 【2】方式2:g
阅读全文
摘要:Git常用命令 git status 看的是工作区和缓存区的状态 创建一个文件,然后查看状态: 然后将Demo2.txt通过git add命令提交至:暂存区: 查看状态: 利用git commit 命令将文件提交至:本地库 现在修改Demo2.txt文件中内容: 然后再查看状态: 重新添加至:暂存区
阅读全文
摘要:Git常用命令 一、add和commit命令 添加文件:add 提交文件:commit 展示: 【1】先创建一个文件: 【2】将文件提交到暂存区: 【3】将暂存区的内容提交到本地库: 注意事项: (1)不放在本地仓库中的文件,git是不进行管理 (2)即使放在本地仓库的文件,git也不管理,必须通过
阅读全文
摘要:初始化本地仓库 1、创建一个文件夹: 2、打开Git终端 Git Bash Here: 进入以后先对字体和编码进行设置: 在Git中命令跟Linux是一样的: (1)查看git安装版本: (2)清屏: (3)设置签名: 设置用户名和邮箱: (4)本地仓库的初始化操作: .git目录是隐藏的:可以调出
阅读全文
摘要:代码托管中心_本地库和远程库的交互方式 1、代码托管中心是干嘛的? 我们已经有了本地库,本地库可以帮我们进行版本控制,为什么还需要代码托管中心呢? 它的任务是帮我们维护远程库, 下面说一下本地库和远程库的交互方式,也分为两种: (1)团队内部协作 (2)跨团队协作 2、托管中心种类 局域网环境下:
阅读全文
摘要:Git结构 本地结构 工作区:就是写代码的地方,写的文件都存在工作区 暂存区:打算提交的东西还没提交,作为暂时存储的区域,可以将代码提交到本地库,或者撤回工作区 本地库:存储的是真正的每个版本的信息
阅读全文
摘要:git安装 1、Git官网 https://git-scm.com/ 2、安装过程 点击Git Bash Here打开Git终端:
阅读全文
摘要:1、Git技术: 公司必备,一定要会 2、Git概念: Git是一个免费的、开源的分布式版本控制系统,可以快速高效地处理从小型到大型的项目。 3、什么是版本控制 版本控制是一种记录一个或者若干个文件内容变化,以便将来查阅特定版本修订情况的系统 SVN(集中化版本控制系统) Git(分布式版本控制系统
阅读全文
摘要:数据清洗和准备 二、数据转换 移除重复数据 data = pd.DataFrame({'k1':['one','two']*3+['two'], 'k2':[1,1,2,3,3,4,4]}) data Out: k1 k2 0 one 1 1 two 1 2 one 2 3 two 3 4 one
阅读全文
摘要:数据清洗和准备 一、处理缺失数据 data1 = pd.Series(['a','b',np.nan,'d']) data1 Out: 0 a 1 b 2 NaN 3 d dtype: object data1.isnull() Out: 0 False 1 False 2 True 3 False
阅读全文
摘要:数据聚合与分组 什么是分组聚合?如图: groupby:(by=None,as_index=True) by:根据什么进行分组,用于确定groupby的组 as_index:对于聚合输出,返回以组便签为索引的对象,仅对DataFrame df1 = pd.DataFrame({'fruit':['a
阅读全文
摘要:数据清洗 一、数据清洗和准备 数据清洗是数据分析关键的一步,直接影响之后的处理工作 数据需要修改吗?有什么需要修改的吗?数据应该怎么调整才能适用于接下来的分析和挖掘? 是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作 1. 处理缺失数据: pd.fillna() pd.dropna()
阅读全文
摘要:数据读取与存储 csv文件 1、读取csv文件read_csv(file_path or buf,usecols,encoding):file_path:文件路径,usecols:指定读取的列名,encoding:编码 data = pd.read_csv('d:/test_data/food_ra
阅读全文
摘要:Pandas统计计算和描述 arr1 = np.random.rand(4,3) pd1 = pd.DataFrame(arr1,columns=list('ABC'),index=list('abcd')) f = lambda x: '%.2f'% x pd2 = pd1.applymap(f)
阅读全文
摘要:层级索引(hierarchical indexing) 下面创建一个Series, 在输入索引Index时,输入了由两个子list组成的list,第一个子list是外层索引,第二个list是内层索引。 import pandas as pd import numpy as np ser_obj =
阅读全文
摘要:Pandas的函数应用 apply 和 applymap 1、可直接使用Numpy的函数 # Numpy ufunc 函数 df = pd.DataFrame(np.random.randn(5,4) - 1) print(df) print(np.abs(df)) 运行结果: 0 1 2 3 0
阅读全文
摘要:Pandas的对齐运算 1、算术运算和数据对齐 1、Series 的对齐运算 s1 = pd.Series(np.arange(4),index=['a','b','c','d']) s2 = pd.Series(np.arange(5),index=['a','c','e','f','g']) s
阅读全文
摘要:高级索引 1、loc 标签索引 2、iloc 位置索引 3、ix 标签与位置混合索引 1、loc 标签索引 # Series ps1 Out: a 888 b 1 c 2 d 3 e 4 dtype: int64 # loc 标签索引 # loc 是标签名的索引,自定义的索引名 ps1['a':'c
阅读全文
摘要:Pandas的索引操作 1、Series和DataFrame中的索引都是Index对象 import numpy as np import pandas as pd ps1 = pd.Series(range(5),index=['a','b','c','d','e']) type(ps.index
阅读全文
摘要:DataFrame的基本用法 1、T转置 # dataframe pd5 = pd.DataFrame(np.arange(9).reshape(3,3),index=['a','b','c'],columns=['A','B','C']) pd5 A B C a 0 1 2 b 3 4 5 c 6
阅读全文
摘要:DateFrame DateFrame:一个二维标记数据结构,具有可能不同类型的列,每一列可以是不同值类型(数值,字符串,布尔值),既有行索引也有列索引。我们可以把它看作为excel表格,或者SQL表,或Series对象的字典。 构建DateFrame的方法: 字典类:数组、列表或元组构成的字典构造
阅读全文
摘要:series的基本用法 1、is null 和 not null 检查缺失值 s4.isnull() #判断是否为空,空就是True city False name False age False sex True dtype: bool s4.notnull() # 判断是否不为空,非空就是Tru
阅读全文
摘要:Numpy数组操作 索引和切片: 获取某行的数据: # 1. 如果是一维数组 a1 = np.arange(0,29) print(a1[1]) #获取下标为1的元素 a1 = np.arange(0,24).reshape((4,6)) print(a1[1]) #获取下标为1的行的数据 连续获取
阅读全文
摘要:一、Numpy数组基本用法 1、Numpy是Python科学计算库,用于快速处理任意维度的数组。 2、NumPy提供一个N维数组类型ndarray,它描述了相同类型的“items”的集合。 3、numpy.ndarray支持向量化运算。 4、NumPy使用c语言写的,底部解除了GIL,其对数组的操作
阅读全文
摘要:Numpy库简单介绍 NumPy是一个功能强大的Python库,主要用于对多维数组执行计算。NumPy这个词来源于两个单词-- Numerical和Python。NumPy提供了大量的库函数和操作,可以帮助程序员轻松地进行数值计算。在数据分析和机器学习领域被广泛使用。他有以下几个特点: numpy内
阅读全文
摘要:pandas的数据结构-series Series 1、Series介绍 Series:一种一维标记的数组型对象,能够保存任何数据类型(int, str, float, python object...),包含了数据标签,称为索引。 类似一维数组的对象,index = ['名字','年龄','班级'
阅读全文
摘要:1、为什么要学习pandas numpy已经能够帮助我们处理数据,能够结合matplotlib解决我们数据分析的问题,那么pandas学习的目的在什么地方呢? numpy能够帮我们处理处理数值型数据,但是这还不够, 很多时候,我们的数据除了数值之外,还有字符串,还有时间序列等 比如:我们通过爬虫获取
阅读全文