『现学现忘』Git基础 — 16、Tree对象详解
1、Tree对象介绍
接下来要探讨的 Git 对象类型是树对象(tree object
),它能解决文件名保存的问题。tree
对象可以存储文件名,也允许我们将多个文件组织到一起。
Git以一种类似于UNIX文件系统的方式存储内容,但做了一些简化。所有内容均以树(tree
)对象和数据(blob
)对象的形式存储,其中树对象对应了UNIX中的目录项,数据对象blob
则大致上对应了文件中的内容。
一个树对象可以包含一条或多条记录(tree
对象和blob
对象),每条记录含有一个指向blob
对象或者子tree
对象的SHA-1
指针,以及相应的模式、类型、文件名信息。
如下图:
# 文件模式、对象类型、对象的SHA-1指针、文件名
100644 blob fa49b077972391ad58037050f2a75f74e3671e92 new.txt
Tree对象存储方式如下图所示:
2、Tree对象说明
(1)初始化一个新的本地版本库
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning
$ git init
Initialized empty Git repository in J:/git-repository/git_learning/.git/
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ ll -a
total 8
drwxr-xr-x 1 L 197121 0 4月 11 14:50 ./
drwxr-xr-x 1 L 197121 0 4月 10 20:23 ../
drwxr-xr-x 1 L 197121 0 4月 11 14:50 .git/
(2)创建一个树对象(重点)
1)新建一个文件,然后把文件提交到本地版本库。
例如:新建文件test.txt
,文件内容version 1
。
# 创建文件
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ echo "version 1" >> test.txt
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ ll
total 1
-rw-r--r-- 1 L 197121 10 4月 11 14:57 test.txt
# 查看文件内容
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ cat test.txt
version 1
2)把test.txt
文件,提交到本地版本库。
# 1.test.txt文件提交到本地版本库
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git hash-object -w ./test.txt
83baae61804e65cc73a7201a7252750c76066a30
# 2.查看Git数据库内容,可以看到新增了一个blob对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ find .git/objects -type f
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git cat-file -t 83baae61804e65cc73a7201a7252750c76066a30
blob
# 3.查看blob对象对象内容
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git cat-file -p 83baae61804e65cc73a7201a7252750c76066a30
version 1
以上就和我们讲blob
对象的操作一样。
此时test.txt
文件被管理在Git本地版本库中。
3)创建一个树对象。
通常Git是根据暂存区或者索引文件index来创建tree对象,因此要把文件存储到暂存区进并建立index
文件。
提示1:
index
文件在.git
目录中,最新初始化的Git本地仓库是没有index
文件,只有添加过一次数据到暂存区之后,才会在.git
目录中自动生成index
文件。
新初始化的.git
目录内容如下:是没有index
文件的。
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ ll .git/
total 7
-rw-r--r-- 1 L 197121 130 4月 11 14:50 config
-rw-r--r-- 1 L 197121 73 4月 11 14:50 description
-rw-r--r-- 1 L 197121 23 4月 11 14:50 HEAD
drwxr-xr-x 1 L 197121 0 4月 11 14:50 hooks/
drwxr-xr-x 1 L 197121 0 4月 11 14:50 info/
drwxr-xr-x 1 L 197121 0 4月 11 14:59 objects/
drwxr-xr-x 1 L 197121 0 4月 11 14:50 refs/
提示2:
可以通过git ls-files
命令查看暂存区的文件信息。
参数信息如下,括号中简写:
--cached(-c)
: 查看暂存区中文件。git ls-files
命令默认执行此选项。--midified(-m)
:查看修改的文件。--delete(-d)
:查看删除过的文件。--other(-o)
:查看没有被Git跟踪的文件。--stage(-s)
:显示mode以及文件对应的Blob对象,进而我们可以获取暂存区中对应文件里面的内容。
例如:git ls-files -c
或者git ls-files --cached
(其他命令同理)
我们常用git ls-files -s
命令查看暂存区的文件信息。
接下来,我们可以通过底层命令:update-index
、write-tree
、read-tree
等命令,轻松创建自己的tree
对象。
# 1.查看暂存区当前状态,可以看到没有任何显示
# 说明暂存区没有存储任何文件
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
# 2.把test.txt文件存入暂存区
# 通过git update-index命令实现
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git update-index --add --cacheinfo 100644 \
> 83baae61804e65cc73a7201a7252750c76066a30 test.txt
# 3.再次查看暂存区当前状态,可以看到暂存区中有一个文件了。
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
100644 83baae61804e65cc73a7201a7252750c76066a30 0 test.txt
# 这里就说明了为什么之前要把test.txt文件先存入到本地版本库中了,
# 因为需要文件的hash键,来添加到暂存区。
### 这里也说明了文件名和文件hash键的结合。(重点)
命令说明:
- 为创建一个树对象,首先需要通过暂存一些文件到暂存区。
通过底层命令git update-index
将一个单独文件存入暂存区中。 --add
选项:因为此前该文件并不在暂存区中,一个文件首次添加到暂存区,需要使用--add
选项。--cacheinfo
选项:因为要添加的test.txt
文件位于Git 数据库中(上一步的操作),而不是位于当前工作目录,所以需要--cacheinfo
选项。- 最后需要指定
文件模式
、SHA-1
与文件名
。
文件模式说明:
100644
:表明这是一个普通文件。(blob对象的文件模式一般都为100644)100755
:表示一个可执行文件。120000
:表示一个符号链接。
继续,下面来观察生成的树对象::
# 4.完成上面步骤后,查看.git目录
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ ll .git/
total 8
-rw-r--r-- 1 L 197121 130 4月 11 14:50 config
-rw-r--r-- 1 L 197121 73 4月 11 14:50 description
-rw-r--r-- 1 L 197121 23 4月 11 14:50 HEAD
drwxr-xr-x 1 L 197121 0 4月 11 14:50 hooks/
-rw-r--r-- 1 L 197121 104 4月 11 15:39 index # 出现了index文件
drwxr-xr-x 1 L 197121 0 4月 11 14:50 info/
drwxr-xr-x 1 L 197121 0 4月 11 14:59 objects/
drwxr-xr-x 1 L 197121 0 4月 11 14:50 refs/
# 这里提示一下,暂存区Stage可以理解成是一个简单的索引文件。
# 指的就是.git/index文件。(重点)
# 5.现在先查看一下Git数据库内容,还是之前那一个blob对象。
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ find .git/objects -type f
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30
# 6.把暂存区中的内容提交到本地版本库
# 换句话说就是把暂存区中存放的文件索引(快照)提交到本地版本库。
# 使用write-tree命令实现
# 也就是通过write-tree命令生成树对像
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git write-tree
d8329fc1cc938780ffdd9f94e0d364e0ea74f579
# 7.再次查看Git数据库内容,多了一个d8对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ find .git/objects -type f
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30
.git/objects/d8/329fc1cc938780ffdd9f94e0d364e0ea74f579
# 8.查看d8对象的类型,可以看到是一个树对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git cat-file -t d8329fc1cc938780ffdd9f94e0d364e0ea74f579
tree
# 9.再次查看暂存区当前状态,发现暂存区的内容没有清空
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
100644 83baae61804e65cc73a7201a7252750c76066a30 0 test.txt
# 说明:在查看暂存区,发现暂存区的内容没有清空,即:暂存区内容写到版本库,暂存区不清空。(重点)
4)总结
以上就是在Git中,使用底层命令手动创建一个树对象的过程。
- 创建一个文件,把该文件通过
git hash-object
命令存储到本地版本库中。 - 通过
git update-index
命令,把文件存储到暂存区中。 - 通过
git write-tree
命令,把暂存区中的文件索引信息提交到本地版本库,生成了一个树对象。
(3)创建第二个文件(重点)
1)新增new.txt
文件,并修改test.txt
文件内容。
# 1.创建new.txt文件
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ echo "new file" > new.txt
# 2.修改test.txt文件内容
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ echo "version 2" >> test.txt
# 3.查看两个文件的内容
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ cat new.txt
new file
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ cat test.txt
version 1
version 2
# 4.查看工作目录中的文件
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ ll
total 2
-rw-r--r-- 1 L 197121 9 4月 11 16:25 new.txt
-rw-r--r-- 1 L 197121 20 4月 11 16:25 test.txt
2)将new.txt
文件和test.txt
文件的第二个版本添加到暂存区。
将test.txt
文件添加到暂存区。
# 1.查看暂存区当前文件信息
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
100644 83baae61804e65cc73a7201a7252750c76066a30 0 test.txt
# 2.把test.txt文件提交到本地版本库
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git hash-object -w ./test.txt
0c1e7391ca4e59584f8b773ecdbbb9467eba1547
# 3.查看Git数据库内容,可以看到又多出一个0c对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ find .git/objects -type f
.git/objects/0c/1e7391ca4e59584f8b773ecdbbb9467eba1547
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30
.git/objects/d8/329fc1cc938780ffdd9f94e0d364e0ea74f579
# 提示:因上面修改了test.txt文件内容,在提交到版本库,内容不一样了hash就变了。
# 4.把修改后的test.txt文件加入暂存区
# 因为之前提交过test.txt文件到暂存区,所以不用加--add选项
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git update-index --cacheinfo 100644 \
> 0c1e7391ca4e59584f8b773ecdbbb9467eba1547 test.txt
# 5.查看暂存区当前文件信息
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
100644 0c1e7391ca4e59584f8b773ecdbbb9467eba1547 0 test.txt
# 我们可以看到,暂存区的test.txt文件被最新修改的版本覆盖了,
# 之前是83开头的
# 提示:暂存区是按对应文件覆盖的,新修改的文件,覆盖之前的原文件,
# 不会覆盖其他文件,即暂存区不是整体覆盖的。(重点)
将new.txt
文件添加到暂存区。
# 1.new.txt文件添加到暂存区
# 这次我们直接用一个命令把new.txt文件从工作区直接添加到暂存区
# 说明:
# 因为是new.txt文件是第一次添加到暂存区,所以需要--add选项
# 因为是从new.txt文件是在工作区,所以不需要--cacheinfo选项
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git update-index --add new.txt
# 2.查看Git数据库内容,可以看到对了一个fa对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ find .git/objects -type f
.git/objects/0c/1e7391ca4e59584f8b773ecdbbb9467eba1547
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30
.git/objects/d8/329fc1cc938780ffdd9f94e0d364e0ea74f579
.git/objects/fa/49b077972391ad58037050f2a75f74e3671e92
# 3.查看暂存区当前文件信息,new.txt文件已经添加到暂存区中
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
100644 fa49b077972391ad58037050f2a75f74e3671e92 0 new.txt
100644 0c1e7391ca4e59584f8b773ecdbbb9467eba1547 0 test.txt
说明:git update-index --add 文件名
完成了之前的两步操作。
- 把
new.txt
文件内容存入了Git版本库。 - 把
new.txt
文件添加到了暂存区中。
3)把暂存区的内容提交的本地版本库。
此时工作目录和暂存区中的文件状态是一样的, 可以通过git write-tree
命令提交到本地版本库,生成树对像了。
# 1.提交暂存区内容
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git write-tree
163b45f0a0925b0655da232ea8a4188ccec615f5
# 2.查看Git数据库内容,可以看到又多了一个名为16的tree对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ find .git/objects -type f
.git/objects/0c/1e7391ca4e59584f8b773ecdbbb9467eba1547
.git/objects/16/3b45f0a0925b0655da232ea8a4188ccec615f5
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30
.git/objects/d8/329fc1cc938780ffdd9f94e0d364e0ea74f579
.git/objects/fa/49b077972391ad58037050f2a75f74e3671e92
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git cat-file -t 163b45f0a0925b0655da232ea8a4188ccec615f5
tree
此时Git版本库中的5个对象,即表示了项目的2个版本。(不明白这句话?继续往下看)
(4)将第一个树对象加入暂存区,使其成为新的树对
# 1.查看暂存区当前文件信息
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
100644 fa49b077972391ad58037050f2a75f74e3671e92 0 new.txt
100644 0c1e7391ca4e59584f8b773ecdbbb9467eba1547 0 test.txt
# 2.将第一个树对象加入暂存区
# 第一个树对象hash:d8329fc1cc938780ffdd9f94e0d364e0ea74f579
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git read-tree --prefix=bak d8329fc1cc938780ffdd9f94e0d364e0ea74f579
# 3.再次查看暂存区当前文件信息,有多了一个bak/test.txt文件
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git ls-files -s
100644 83baae61804e65cc73a7201a7252750c76066a30 0 bak/test.txt
100644 fa49b077972391ad58037050f2a75f74e3671e92 0 new.txt
100644 0c1e7391ca4e59584f8b773ecdbbb9467eba1547 0 test.txt
说明:
read-tree
命令:可以把树对象读入暂存区。--prefix=bak
选项:将一个已有的树对象作为子树读入暂存区。
接下来继续,再提交暂存区的内容,会继续生成一个新的tree
对象在Git仓库中。
# 把暂存区的内容生成新的tree对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git write-tree
01ab2a43b1eb150bcf00f375800727df240cf653
# 查看新生成的对象
# 查看tree对象的类型
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git cat-file -t 01ab2a43b1eb150bcf00f375800727df240cf653
tree
# 查看tree对象的内容,也就是记录暂存区的内容。
# 可以看到该tree对象,包含了两个blob对象和一个tree对象。
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ git cat-file -p 01ab2a43b1eb150bcf00f375800727df240cf653
040000 tree d8329fc1cc938780ffdd9f94e0d364e0ea74f579 bak
100644 blob fa49b077972391ad58037050f2a75f74e3671e92 new.txt
100644 blob 0c1e7391ca4e59584f8b773ecdbbb9467eba1547 test.txt
# 查看当前Git仓库中的对象
L@DESKTOP-T2AI2SU MINGW64 /j/git-repository/git_learning (master)
$ find .git/objects -type f
.git/objects/01/ab2a43b1eb150bcf00f375800727df240cf653
.git/objects/0c/1e7391ca4e59584f8b773ecdbbb9467eba1547
.git/objects/16/3b45f0a0925b0655da232ea8a4188ccec615f5
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30
.git/objects/d8/329fc1cc938780ffdd9f94e0d364e0ea74f579
.git/objects/fa/49b077972391ad58037050f2a75f74e3671e92
到这里我们的演示就完成了,请看下面的总结。
3、总结
(1)分析每个树对象的存储结构
我们可以先查看一下Git本地库中的对象,如下
.git/objects/01/ab2a43b1eb150bcf00f375800727df240cf653 # 第三个tree树对象
.git/objects/0c/1e7391ca4e59584f8b773ecdbbb9467eba1547 # test.txt第二个版本(blob对象)
.git/objects/16/3b45f0a0925b0655da232ea8a4188ccec615f5 # 第二个tree树对象
.git/objects/83/baae61804e65cc73a7201a7252750c76066a30 # test.txt第一个版本(blob对象)
.git/objects/d8/329fc1cc938780ffdd9f94e0d364e0ea74f579 # 第一个tree树对象
.git/objects/fa/49b077972391ad58037050f2a75f74e3671e92 # new.txt第一个版本(blob对象)
我们接下来用三个图,描述一下三个树对象的结构关系。
第一个树对象结构如下图:
第二个树对象结构如下图:
第三个树对象结构如下图:
也可以换Git对象类型表示:
(2)blob对象和tree对象(重点)
从上图我们可以分析出:
blob
对象代表文件一次次的版本。tree
对象代表项目的一次次的版本。
这就是我前面2-(3)
描述过的Git版本库中的5个对象,即表示了项目的2个版本。
(就先这样理解)
(3)总结(重点)
暂存区的概念和相关理解:
- 所谓的暂存区
Stage
只是一个简单的索引文件而已。指的是是.git/index
文件。 - 暂存区这个索引文件里面包含的是文件的目录树,像一个虚拟的工作区,在这个虚拟工作区的目录树中,记录了文件名、文件的时间戳、文件长度、文件类型以及最重要的SHA-1值,文件的内容并没有存储在其中,所以说它像一个虚拟的工作区。
即:暂存区,也就是.git/index
文件中存放的是文件内容的索引(快照),也可以是tree
对象的索引。 - 索引指向的是
.git/objects/
目录下的文件(Git对象)。 - Git通过暂存区的文件索引信息来创建
tree
对象的。 tree
对象可以使文件内容和文件名进行关联。- 一个树对象可以包含一条或多条记录(
tree
对象和blob
对象)。 - 暂存区内容写到版本库中后,暂存区索引内容不清空。
- 暂存区中的文件内容索引,是按对应文件覆盖的,也就是修改一个文件内容,添加到缓存区,只会把对应的文件覆盖,其他文件不会被覆盖,即:暂存区不是整体覆盖的。
暂存区的作用:除非是绕过暂存区直接提交,否则Git想把修改提交上去,就必须将修改存入暂存区最后才能commit。每次提交的是暂存区所对应的文件快照。
提示:Git对象的hash键,我们截取前几位就行,练习时对象不那么对,就不用全部都写,能够表示唯一对象就行。
4、问题
现在有三个树对象(因为执行了三次write-tree
命令),分别代表了我们想要跟踪项目的三次快照。然而问题依旧:若想重用这些快照,你必须记住这三个树对象的SHA-1
哈希值。
并且,你也完全不知道是谁保存了这些快照,在什么时刻保存的,以及为什么保存这些快照。
而以上这些,提交对象commit object
为你保存了这些基本信息。
5、本文用到的命令总结
Git底层命令:
git update-index --add
:把文件索引(快照)存入暂存区中。git write-tree
:将当前暂存区的索引内容同步到一个树对象中。git ls-files -s
:查看暂存区的文件信息。git read-tree --prefix=bak
:将一个已存在的树对象添加到暂存区。git cat-file -t 键
:查看Git对象的类型。git cat-file -p 键
:查看Git对象的内容。
参考: