MIT-Missing-Semester

https://missing-semester-cn.github.io/

1.shell

cd - 返回之前的目录
>> 输出重定向为追加而不是覆盖
目录权限：r 查看目录文件列表，w 在目录中重命名、删除、创建文件，x 搜索权限，是否允许进入该目录
tee FILENAME 将输入内容同时输出至标准输出和文件
tail -n x 输出输入的最后 x 行

2.shell 工具、脚本

空格分割参数，因此 foo = bar 无法赋值

"Value is $foo" 将展开 foo 变量的值，'Value is $foo' 则不
$_ 上一个命令的最后一个参数
$# 为参数数量
$$ 为进程 PID
$@ 将把所有参数展开，展开结果类似集合，可以：for filename in "$@"; do
!! 被替换为上一个命令
; 将两个语句连接在同一行

$(pwd) 将展开为 pwd 命令的输出
2> 用于重定向标准错误流
process substitution：A <(B1) <(B2) ... 依次执行 B1,B2... 并将输出放入一个类似临时文件的东西中（每个命令都将产生一个不同的临时文件），将这些文件的标识符提供给 A。这意味着 A 的参数应为文件，如 cat，ls：

$ ls <(ls) <(ls ..)
/dev/fd/62  /dev/fd/63

source xxx.sh 在 shell 中加载并执行 xxx.sh
多个参数 xxxA xxxB xxxC 可缩写为 xxx{A,B,C}。xxx{A,B,C}yyy{D,E} 将展开为 6 个参数。{a..z} 等可用
shebang：在脚本的第一行给出解释方法，例如 #!/bin/sh，可用 #!/usr/bin/env python 等检测解释器路径
cd xxx || exit 进入目录失败即退出
/dev/null 将抛弃所有输入内容

tldr COMMAND 给出命令使用例子
touch FILENAME 修改文件访问时间为当前
find -exec COMMAND {} \; 用于对每个 find 的结果分别执行命令，find -exec COMMAND {} + 用于将每个 find 的结果依次作为命令的多个参数执行一次命令。其中花括号引用 find 的结果
locate xxx 查找并构建索引
grep xxx FILENAME 在文件中查找字符，-R 选项递归。类似有 rg 命令，ripgrep
grep -v 查找不匹配的项
fzf 交互、模糊查找
tree 树形打印目录结构
cut 可以输入按照自定义的分隔符分成若干段，并输出其中某些段
tr 替换、缩减、删除标准输入中的字符，例如 tr -s ' ' 将所有连续空格缩减为一个
xargs 从标准输入中获得参数，并送给指定命令

3.vim

tabnew 生成新标签页，每个标签页有若干窗口，每个窗口对应一个缓冲区。一个缓冲区可对应多个窗口，例如当同时查看一个文件的多个部分时
c change 操作，行为与 d 相同但删除后进入插入模式
shift-v 可视行，每次选择一整行
~ 反转大小写
. 重复前一个编辑操作
数字+操作 执行指定次数操作
% 在可匹配的字符间跳转
a 和 i 修饰符，分别为 around inside，操作+a/i+可匹配字符可删除括号中所有内容，a 包括括号本身，i 不包括。例如 di(

4.data wrangling

less 在终端中阅读
sed 流文本编辑器，sed -E 使用更现代的正则语法
wc word count，-l 可计算行数
sort 将输入的行排序，uniq 将排好序的输入去重
awk 基于列的流处理器，参数需使用单引号
bc 命令行计算器
paste 将多个文件中的相同行号的行合并为同一行，或将一个文件中的不同行合并为同一行

正则：
* 0 或多次，+ 1 或多次，? 0 或 1 次
默认每行只匹配一次，但贪心匹配，如 xxxAxxxA 将被正则语句 .*A 完全匹配
在 * 或 + 后加 ? 可使匹配变为非贪心，在上面的例子中匹配将停在第一个 A 处
capture groups：每个小括号之间的内容将成为一个捕获组，可以在替换中用 \+数字引用，例如 \2 引用第二个捕获组
https://regex101.com/

5.command line environment

jobs control

signal：终端可通过信号与程序通信，如 SIGINT、SIGHUP 等，大部分可被程序捕获并绑定行为，但 SIGKILL 等无法捕获
jobs 显示当前任务的状态，bg 将任务移动至后台，可依此继续运行停止的程序，如 bg %1
kill 可发送任何类型的信号，如 kill -STOP %1。另外，kill -0 将不会发送任何信号，若进程不存在则返回状态码非零，可用于检测进程是否结束
nohup COMMAND 将忽略挂起信号 SIGHUP，可避免登出时终止
pgrep pkill 可分别用来根据进程名查找、结束进程，后者也同 kill 一样可以发送任何类型的信号

terminal multiplexer

tmux

session 包含 window 包含 pane

session 命令
tmux new 新建 session，-t xxx 指定名称
tmux a -t xxx 回到指定 session
tmux ls 列出所有 session
tmux kill-session -t xxx 杀死指定 session

window 操作：快捷键+修饰符
control-b 改变窗口，修饰符：d 退出（窗口将被保留），p,n 分别为上、下一个窗口，c 新建，数字跳转指定窗口，, 重命名窗口，& 关闭当前窗口

pane 操作：快捷键+修饰符
control-b 改变面板，修饰符：" 水平分裂窗口，% 垂直分裂窗口，方向键改变聚焦的面板，空格将所有面板等距分布，z 使面板占据整个窗口（或恢复），x 关闭当前面板，control-arrow key 按箭头方向调整大小，! 将当前面板拆分为独立窗口
{} 将当前面板与上、下一个交换位置，;o 切换到上、下一个面板

如果在 tmux 中想对终端使用 control-b，则需按两次

在 ~/.tmux.conf 中使用如下设置即可改变默认的前缀组合键 control-b

set -g prefix C-a
unbind C-b
bind C-a send-prefix

others

alias xxx=COMMAND 为长命令设置别名，只对当前会话生效
环境变量 PS1 指定了提示符，如 [\u@\h \W]\$

6.version control

git 工作原理

git 将文件夹、文件分别建模为 tree 和 blob，每次提交的快照被建模为 commit
所有的版本将被记录为有向无环图上的一个节点，指向的节点为作出此次更改前的节点。若在开发中出现分支，将两个分支合并时，新的版本就会同时指向被合并的两个节点。因此，它们构成了有向无环图
每个节点对应了一个版本快照，同时包含了作者、时间等元数据

数据在 git 中均通过哈希后的 id 来索引，可以根据这样的 id 来找到相应的指针：

type blob = array<byte>
type tree = map<string , tree | blob>
type commit = struct{
    parents: array<commit>  //指向的节点
    author: string
    message: string
    snapshot: tree   //该快照的根目录
}
type object = blob | tree | commit
objects = map<string , object>   //通过 object 的 SHA-1 值映射到它的指针
def store(o):
    id = hash(o)
    objects[id] = o
def load(id):
    return objects[id]
references = map<string , string>   //通过可读的版本描述映射到相应快照的 SHA-1

基本指令

工作目录独立于 git 的所有分支
git 存在一个 stagin area，决定 git 在下次创建快照的时候会包含哪些更改
git add FILENAME 将文件、文件夹从工作目录加入缓冲区。git add :/ 将加入仓库中的所有内容
git status 将显示这个缓冲区，以及 commit 的记录等
git commit 将提交缓冲区中内容，显示此快照的哈希值的一部分。git commit -a 将提交所有更改
git cat-file -p HASH 将显示该哈希对应的 object 的全部内容
git log --all --graph --decorate 将显示所有的提交记录为图，而不是线性展示。其中 HEAD 指最后一个快照
git checkout HASH/BRANCHNAME 将通过哈希值、分支名，改变工作目录到某个其他的提交。这将确实地更改目录中文件的内容
git checkout FILENAME 将舍弃工作目录中该文件的更改，回到 HEAD 指向的快照的中的状态
git diff NAME NAME 可对比两个 object 的差异，哈希值、描述名、文件名等均可作为 NAME
git diff xxx yyy FILENAME 将比较两个快照中某文件的差异

branch

git branch NAME 将创建一个新的分支，可以通过 checkout 命令切换到某个分支，该操作也会更改工作目录中的文件。当创建新的提交时，当前处于的分支将会和 HEAD 一起指向新的快照
git branch -vv 查看详细的分支信息
git merge BRANCHNAME 将相应的分支合并到当前快照，可一次合并多个分支

Fast-forward merge
- 当当前 HEAD 指向的快照是要被合并的快照的祖先时，不需创建新的 commit，只用更改 HEAD 指针
- 可以使用 --no-ff 选项禁用这个特性
- 常见于被 git pull 调用时
True merg
- Auto-merge 尝试自动合并
- Auto-merge failed，将在合并失败的文件中的冲突进行标记，手动修改，并重新 add 后使用 git merge --continue 继续合并
- 合并出现冲突时，git merge --abort 可放弃合并并尝试退回合并前的状态，这也意味着会更改工作目录中的文件

远程仓库

git remote 将列出所有远程仓库
git remote add NAME URl 添加远程仓库，标记名字（例如 origin）等
git push <remote> <local branch>:<remote branch> 将本地分支推送到远程，将在远程仓库上创建一个新分支或更新某个分支
git clone URl PATH 将远程仓库克隆到本地，可选储存路径。使用该下载的副本初始化本地仓库
在其他机器上进行修改并 push 后，push 到的机器并不能立刻接到修改

使用 git fetch <remote> 来与进行了 push 的远程仓库通信，同步更改，这不会更改任何本地文件、分支、HEAD 指针等
fetch 后可以 merge 到同步了的版本，这就是一种 Fast-forward merge
git pull 将先后这两条命令

git clone --shallow 不会克隆仓库的整个历史记录，只下载最新快照来避免下载量过大

others

git add -p FILENAME 将交互式地将文件添加进缓冲区，可用于只提交文件的某些更改。这样 add 并 commit 完，就就可以 checkout 这个文件来舍弃不想要的更改
与上面相应，git diff 查看的是目前没有进入缓冲区的修改，而 git diff --cached 查看的是进入了缓冲区的修改
git blame FILENAME 将查看文件每行修改的时间、人、提交等信息
git stash 将工作目录还原回上次提交的状态，但不会完全删除这些更改，git stash pop 将还原这些更改
git bisect 将二分查找提交历史记录，例如找到第一个不能通过测试脚本的提交
.gitignore 文件中写入文件名模式，可以让 git 忽略这些文件不提示 untracked。该文件应该被跟踪

git log -x FILENAME 查看在最新的 x 次提交某文件的信息

7.debugging and profiling

logger 向系统日志中写入
tac 将反向输出文件内容，与 cat 相反

real time：程序开始运行到结束的总时间
user time：CPU 执行用户级别代码所用的时间
system time：CPU 执行内核级别代码所用的时间

profilers

tracing profilers：会在代码中插入内容，与原本的代码一起运行，在进入函数的时候记录相关信息得出运行时间
sampling profilers：每隔一小段时间暂停程序，报告当前执行到的位置

内存分析器，python memory_profiler，C valgrind
perf 与 time 类似，运行程序并跟踪内存相关的统计数据

lsof 列出被进程打开的各种文件的信息
hyperfine 可对两个程序的执行情况（用时等）进行比较

htop, du, ncdu
可视化工具：flame graph

8.meta programming

build system

make 需要给出构建的目标，目标所需的依赖，从依赖编译出目标的规则
make <target> 将构建指定的目标，如果没有参数来指定，默认会构建第一个

基本的语法是：

<target> : <prerequisites>
[tab]  <commands>

规则即为对依赖项执行的命令，命令前默认必须为 tab，可以通过更改内置变量 .RECIPEPREFIX 控制这个前缀
命令可以有多行，但每行在一个独立的 shell 中运行，也就是变量等无法继承共享
可以使用分号将所有命令写在一行，也可在 target 前一行声明 .ONESHELL:

% 可以进行模式匹配，例如 %.o: %.c 让所有 o 文件依赖相同名字的 c 代码
makefile 定义变量与 shell 相似，也存在一些自动变量，$* 将被扩展为上面一行说的的匹配的模式，$@ 扩展为目标文件名，$< 扩展为第一个依赖，@^ 扩展为全部依赖并用空格隔开
也存在一些内置变量
定义函数的方法是

define function
endef

调用函数是 $(function arguments)，存在一些内置函数

phony target 是一个操作而不是文件，作为一种伪目标，例如：

.PHONY: clean
clean:
      rm *.o

当没有任何叫做 clean 的文件时，第一行可以省略
当我们最终构建的结果有多个文件时，可以使用 phony target source: a b c，这样只需执行 make source 一条命令，即可构建出三个文件
也可定义 test 目标，来执行测试

semantic versioning

x.y.z 分别代表主要、次要、补丁版本号
在补丁更新中应增加补丁版本号，进行了向前兼容的更新时应增加次要版本号，进行了不向前兼容的更新时应增加主要版本号
因此，在 x 与需要依赖的版本相同时，只要 y 大于等于需要依赖的版本，即可成功依赖

lockfile 列出了当前每个依赖所对应的具体版本号，避免了构建程序自动将依赖更新到其他版本
vendoring 指为把依赖直接复制到项目中

others

continues integration 持续集成，一种类似于钩子函数的东西，例如 github pages, codecov 等，.git/hooks 也包含一些执行类似功能的脚本

tests

单元测试，集成测试，回归测试
mocking

9.security and cryptography

entropy 熵

度量一种密码的安全性，单位为 bit
若某种生成密码的方式有 $x$ 生成的可能，那么熵就是 $\log_2(x)$
如 AES-256 就代表其密钥具有 256bit 的熵

salt

在 openssl 等工具中，经常有 -salt 这样的参数
salt 是一串长随机字符串，对每个要加密的对象都会独立随机出一个不同的 salt
salt 是可以公开的，将需要加密的对象和 salt 一起（例如将 salt 放到明文的后面）进行加密

一个例子：网站在服务器上储存密码时通常会储存加密后的密码，来避免泄漏密码明文
如果众多网站使用同一种加密方式，相同密码的密文就将是相同的，如果构建一个巨大的彩虹表（不同字符串与其密文的对应），就能查表得到这些密码的明文
而 salt 因为每个网站、每个用户都是单独随机的，不相同，加密出的密文也就不相同，就解决了这个问题

Asymmetric key cryprography

sign：接受信息和私钥，生成签名
verify：接受信息、签名和公钥，返回签名是否正确

用于签署发布的文件，使下载者确保文件来自正确的人

bootstrapping problems

引导问题：指如何在没有预共享密钥和信任基础的情况下，建立安全通信渠道的问题

例如：如何确定我找到的某人的公钥，确实是他的公钥，而不是他人伪造的

使用非网络渠道交换公钥
使用中心服务器储存从用户、手机号等到相应人的公钥的对应，这会产生对这个服务器的信任的问题
Signal 的做法是互相扫描对方代表公钥的二维码，但这与第一种方法本质相同
PGP，即构建信任网，通过“我信任我朋友信任的人”
keybase.io，将公钥和一些列社交身份相绑定，这样可以通过其中某个社交身份来获得公钥。“社交身份”可以是各种网站的帐号等，这基于攻击者很难同时入侵某人的所有帐号（即社交身份）

hybird encryption

非对称加密的速度一般是较慢的，而对称加密较快
因此，在加密大文件时，可以先生成一个对称加密密钥，用其对文件进行对称加密
使用非对称加密的公钥对这个对称加密密钥进行非对称加密，因为这个密钥远远小于文件大小，因此对它即使是非对称加密速度也是很快的
将对称加密过的文件和非对称加密过的密钥一起发布
接受者则可以先用非对称加密的密钥解密出这个对称加密的密钥，然后再使用对称加密的方法解密文件

10 & 11.others

daemon

大部分守护进程程序名以 d 结尾

systemd
定期运行程序：cron

fuse

用户空间文件系统

dash

single dash，用 - 代替输入输出文件名，表示使用标准输入输出
double dash，在 -- 后的参数均不会被解释为标志参数，而是文件名等，例如 rm -- -r 将会删除名为 -r 的文件

Hammerspoon

Hammerspoon 是 macos 的桌面自动化框架，可以通过绑定按钮、按键、各种事件等来运行 lua 代码
TODO：linux 中应该会有相似工具

file structure

/bin 一般存放基本的系统程序，/usr/bin 一般存放用户程序，/usr/local/bin 一般存放用户自己编译安装的程序
/sbin 一般存放给 root 执行的程序，/usr/sbin 则是一般给 root 运行的用户程序
发行版之间存在区别，arch linux 中 /bin 和 /sbin 都是指向 /usr/bin 的符号连接
/lib 及其他带有 lib 字眼的文件夹，包含库文件，供程序链接
/etc 一般包含了配置文件
/var 中一般都是随时间变化的文件，比如日志，跟踪 PID 的文件，软件包管理器的 lock file 等
/dev 包含了对应系统设备的特殊文件
/opt 用于给第三方软件安装，一般是从别的平台移植到 linux 的
/sys 包含系统的信息、配置，部分文件直接影响系统运行状态
/tmp 临时文件夹，一般会在重启时清空

data wranling

column -t 将空格隔开的文本转换为对齐的文本
jq 和 pup 用来解析 json 和 html 格式的文件

语言：perl，R 的 ggplot 库
工具：pandoc 转换文件格式

docker

Docker 使用 linux 内核一个 linux container 的特性，当启动一个类似虚拟机的东西，如果他的操作系统与实体机相似，那么可以和实体机共享一个内核，基于内核内置的隔离机制来启动一个程序，docker 这样做这将比完整的虚拟机有更低的开销
但隔离性降低

vim

mark：按下 m 加任意字母，vim 将在光标的位置打下标记，之后按下 ` 加标记时用的字母，即可回到标记处
control-o 将让光标回到上一次移动前的位置，无论是何种类型的移动，control-i 则相反（类似 u 和 control-r 的关系）。该操作允许跨文件移动
:earlier 将会让缓冲区回到较早的版本，基于时间而不是操作，当执行了一些列撤销又对缓冲区进行了更改时，一开始被撤销的内容无法通过 u 和 control-r 还原，这条命令便可以尝试找回这些被撤销的内容
undo tree 插件也可达到相似的目的
搜索在 vim 中是名词，这意味着可以使用 d/{xxx} 之类的指令来从当前位置一直删除到下一个 xxx

markdown

当代码框中含有反引号，行内代码需要两边各使用两个反引号来分割，且反引号和内容之间需要空格
行间代码需要两边各用四个反引号

others

内核跟踪工具：BDF, eBDF

TODO：浏览器插件，将不同网站的 cookie 分容器存放：multi account container

posted @ 2023-09-08 10:30 suxxsfe 阅读(78) 评论(0) 编辑收藏举报

刷新页面返回顶部

suxxsfe

一言（ヒトコト）

友链

suxxsfe

这是子标题

MIT-Missing-Semester

1.shell

2.shell 工具、脚本

3.vim

4.data wrangling

5.command line environment

jobs control

terminal multiplexer

tmux

others

6.version control

git 工作原理

基本指令

branch

远程仓库

others

7.debugging and profiling

profilers

8.meta programming

build system

semantic versioning

others

9.security and cryptography

entropy 熵

salt

Asymmetric key cryprography

bootstrapping problems

hybird encryption

10 & 11.others

daemon

fuse

dash

Hammerspoon

file structure

data wranling

docker

vim

markdown

others

公告